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Hoy en día parece que no existe ningún límite a lo que un ordenador puede llegar a hacer, y 
da la impresión de que cada vez se pueden resolver nuevos y más difíciles problemas. 

Casi desde que aparece sobre La Tierra, el hombre ha tratado de buscar procedimientos y má¬ 
quinas que le facilitasen la realización de cálculos (aritméticos primero, y otros más complejos 
posteriormente). 

El avance tecnológico para representar datos y/o información por un lado, y el diseño de 
nuevas formas de manejarlos, propicia el desarrollo de dispositivos y máquinas de calcular. 

Un aspecto importante en el desarrollo de los ordenadores, es sin duda, su aplicación para 
resolver problemas científicos y empresariales. Esta aplicación hubiese resultado muy difícil sin 
la utilización de procedimientos que permiten resolver estos problemas mediante una sucesión 
de pasos claros, concretos y sencillos, es decir algoritmos. El avance de las matemáticas permite 
la utilización de nuevas metodologías para la representación y manejo de la información. 

Por otro lado, aparece el intento de los matemáticos y científicos para obtener un procedi¬ 
miento general para poder resolver cualquier problema (matemático) claramente formulado. Es 
lo que podríamos llamar El problema de la computación teórica. El avance de la tecnolo¬ 
gía y de las matemáticas, y más en concreto de la teoría de conjuntos y de la lógica, permiten 
plantearse aspectos de la computación en 3 caminos. 

a) Computación teórica. Autómatas, Funciones Recursivas,... 

b) Ordenadores digitales. Nuevas tecnologías, nuevos lenguajes,.... 

c) Intentos de modelizar el cerebro biológico 

1. Redes Neuronales (intentan modelizar el "procesador") 

2. Conjuntos y Lógica Difusa (representar y manejar la información) 

En este texto veremos aspectos relativos a a) y c.l). 

Considermos el problema general, bajo un planteamiento de Programación. 

Desde un punto de vista global, un programa (traducido a lenguaje máquina) se puede ver 
como una sucesión de ceros y unos, cuya ejecución produce una salida, que es otra serie de 
ceros y unos. Si añadimos un 1 al inicio de cada cadena binaria (programa y salida), podemos 
entender los programas como aplicaciones concretas de una función entre números naturales en 
binario. El argumento (variable independiente) sería el programa y la función (var. dependiente) 
la salida del programa. 

Obviamente, el número de funciones posibles de N en N es nonumerable, mientras que el 
número de posibles programas que podemos escribir con un Lenguaje de Programación, que 
tiene un número finito de símbolos, es numerable. 

Esto significa (cada programa puede calcular una sola función como las indicadas antes) que 
existen muchas funciones para las que no podemos escribir un programa en nuestro L. de Alto 
Nivel, aunque seguramente estamos interesados en resolver el problema asociado a la función. 
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Entonces nos preguntamos cosas como: 

¿Para qué problemas no podemos escribir un programa ? 

¿Podremos resolver algunos de estos problemas con otro lenguaje de programación y/o con 
otros computadores ?. 

Además, para los problemas que si tienen un programa asociado, 

¿Se podrá ejecutar el programa en un ordenador actual en un tiempo razonable ? (p.e., antes 
de que llegue nuestra jubilación). 

¿Los ordenadores futuros podrán hacerlo ? 

Trataremos de dar respuestas a algunas de estas cuestiones, a lo largo del desarrollo de la 
asignatura. 


1.1. Introducción Histórica 

Uno de los principales factores determinantes de la profunda revolución experimentada en 
el ámbito de la ciencia, la técnica y la cultura de nuestros días es el desarrollo de la informática. 
La palabra ‘informática’ (Información automática), es un nombre colectivo que designa un 
vasto conjunto de teorías y técnicas científicas -desde la matemática abstracta hasta la inge¬ 
niería y la gestión administrativa- cuyo objeto es el diseño y el uso de los ordenadores. Pero 
el núcleo teórico más sólido y fundamental de todo ese conjunto de doctrinas y prácticas es la 
llamada ‘Teoría de la Computabilidad’, formalmente elaborada en los años 30 y 40 gracias a los 
descubrimientos de lógicos matemáticos como Godel, Turing, Post, Church, y Kleene, aunque 
sus orígenes más remotos datan de antiguo, con el planteamiento de la cuestión de saber si, al 
cabo de cierto esfuerzo, el hombre podría llegar a un extremo en la investigación en que, even¬ 
tualmente, toda clase de problemas pudiera ser atacado por un procedimiento general de forma 
que no requiriera el más leve esfuerzo de imaginación creadora para llevarlo a cabo. Si todo 
queda determinado así en detalle, entonces sería obviamente posible abandonar la ejecución del 
método a una máquina, máxime si la máquina en cuestión es totalmente automática. Esta idea, 
ambiciosa sin duda, ha influido poderosamente en diferentes épocas el desarrollo de la ciencia. 

El propósito inicial es hacer precisa la noción intuitiva de función calculable; esto es, una 
función cuyos valores pueden ser calculados de forma automática o efectiva mediante un al¬ 
goritmo, y construir modelos teóricos para ello (de computación). Así podemos obtener una 
comprensión más clara de esta idea intuitiva; y solo de esta forma podemos explorar mate¬ 
máticamente el concepto de computabilidad y los conceptos relacionadas con ella, tales como 
decibilidad, etc... 

La teoría de la computabilidad puede caracterizarse, desde el punto de vista de las C.C., 
como la búsqueda de respuestas para las siguientes preguntas: 

1) ¿Qué pueden hacer los ordenadores (sin restricciones de ningún tipo )? 

2) ¿Cuales son las limitaciones inherentes a los métodos automáticos de cálculo?. 
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El primer paso en la búsqueda de las respuestas a estas preguntas está en el estudio de los 
modelos de computación. 

Los comienzos de la Teoría. La Tesis de Church-Turing 

Los modelos abstractos de computación tienen su origen en los años 30, bastante antes de 
que existieran los ordenadores modernos, en el trabajo de los lógicos Church, Godel, Kleene, 
Post, y Turing. Estos primeros trabajos han tenido una profunda influencia no solo en el des¬ 
arrollo teórico de las C.C., sino que muchos aspectos de la práctica de la computación que son 
ahora lugar común de los informáticos, fueron presagiados por ellos; incluyendo la existencia 
de ordenadores de propósito general, la posibilidad de interpretar programas, la dualidad entre 
software y hardware, y la representación de lenguajes por estructuras formales basados en reglas 
de producción. 

El punto de partida de estos primeros trabajos fueron las cuestiones fundamentales que D. 
Hilbert formuló en 1928, durante el transcurso de un congreso internacional: 

1. - ¿Son completas las matemáticas, en el sentido de que pueda probarse o no cada aseveración 
matemática? 

2. - ¿Son las matemáticas consistentes, en el sentido de que no pueda probarse simultáneamente 
una aseveración y su negación ? 

3. - ¿Son las matemáticas decidióles, en el sentido de que exista un método definido que se pueda 
aplicar a cualquier aseveración matemática, y que determine si dicha aseveración es cierta?. 

La meta de Hilbert era crear un sistema matemático formal gompletoc consistente", en el que 
todas las aseveraciones pudieran plantearse con precisión. Su idea era encontrar un algoritmo que 
determinara la verdad o falsedad de cualquier proposición en el sistema formal. A este problema 
le llamó el ‘Entscheidungsproblem’. 

Por desgracia para Hilbert, en la década de 1930 se produjeron una serie de investigaciones 
que mostraron que esto no era posible. Las primeras noticias en contra surgen en 1931 con K. 
Godel y su Teorema de Incompletitud: "Todo sistema de primer orden consistente que contenga 
los teoremas de la aritmética y cuyo conjunto de (números de Godel de) axiomas sea recursivo 
no es completo." 

Como consecuencia no será posible encontrar el sistema formal deseado por Hilbert en el 
marco de la lógica de primer orden, a no ser que se tome un conjunto no recursivo de axiomas, 
hecho que escapaba a la mente de los matemáticos. Una versión posterior y más general del 
teorema de Godel elimina la posibilidad de considerar sistemas deductivos más potentes que los 
sistemas de primer orden, demostrando que no pueden ser consistentes y completos a la vez. 

Un aspecto a destacar dentro del teorema de incompletitud de Godel, fué la idea de codifi¬ 
cación. Se indica un método (numeración de Godel) mediante el cual se asigna un número de 
código (entero positivo) a cada fórmula bien formada del sistema (fbf) y a cada sucesión finita 
de fórmulas bien formadas, de tal modo que la fbf o sucesión finita de fbf se recupera fácilmente 
a partir de su número de código. A través de este código, los enunciados referentes a enteros po¬ 
sitivos, pueden considerarse como enunciados referentes a números de código de expresiones, o 
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incluso referentes a las propias expresiones. Esta misma idea fué posteriormente utilizada para 
codificar algoritmos como enteros positivos, y así poder considerar un algoritmo, cuyas entradas 
fuesen enteros positivos, como un algoritmo cuyas entradas fuesen algoritmos. 

El siguiente paso importante lo constituye la aparición casi simultanea en 1936 de varias ca¬ 
racterizaciones independientes de la noción de calculabilidad efectiva, en los trabajos de Church, 
Kleene, Turing y Post. Los tres primeros mostraban problemas que eran efectivamente indecidi- 
bles; Church y Turing probaron además que el Entscheidungsproblem era un problema indeci- 
dible. 

Church propuso la noción de función A-definible como función efectivamente calculable. La 
demostración de teoremas se convierte en una transformación de una cadena de símbolos en otra, 
en cálculo lambda, según un conjunto de reglas formales. Este sistema resultó ser inconsistente, 
pero la capacidad para expresar-calcular funciones numéricas como términos del sistema llamó 
pronto la atención de él y sus colaboradores. 

Gódel habia recogido la idea de Herbrand de que una función f podría definirse por un 
conjunto de ecuaciones entre términos que incluian a la función f y a símbolos para funciones 
previamente definidas, y precisó esta idea requiriendo que cada valor de f se obtenga de las 
ecuaciones por sustitución de las variables por números y los términos libres de variables por 
los valores que ya se habian probado que designaban. Esto define la clase de ‘las funciones 
recursivas de Herbrand-Gódel’. 

En 1936, Church hace un esquema de la demostración de la equivalencia entre las funcio¬ 
nes ^.-definibles y las funciones recursivas de Herbrand-Gódel (esta equivalencia también había 
sido probada por Kleene ); y aventura que estas iban a ser las únicas funciones calculables por 
medio de un algoritmo a través de la tesis que lleva su nombre, y utilizando la noción de función 
^-definible, dió ejemplos de problemas de decisión irresolubles, y demostró que el Entschei¬ 
dungsproblem era uno de esos problemas. 

Por otra parte Kleene, pocos meses después, demuestra formalmente la equivalencia entre 
funciones X-definible y funciones recursivas de Herbrand-Gódel, y dá ejemplos de problemas 
irresolubles utilizando la noción de función recursiva. 

La tercera noción de función calculable proviene del matemático inglés A. Turing, quién 
argumentó que la tercera cuestión de Hilbert (el Entscheidungsproblem) podía atacarse con la 
ayuda de una máquina, al menos con el concepto abstracto de máquina. 

Turing señaló que había tenido éxito en caracterizar de un modo matemáticamente preciso, 
por medio de sus máquinas, la clase de las funciones calculables mediante un algoritmo, lo que 
se conoce hoy como Tesis de Turing. 

Aunque no se puede dar ninguna prueba formal de que una máquina pueda tener esa pro¬ 
piedad, Turing dió un elevado número de argumentos a su favor, en base a lo cual presentó la 
tesis como un teorema demostrado. Además, utilizó su concepto de máquina para demostrar 
que existen funciones que no son calculables por un método definido y en particular, que el 
Entscheidungsproblem era uno de esos problemas. 
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Cuando Turing conoció los trabajos de Church-Kleene, demostró que los conceptos de fun¬ 
ción ^-definible y función calculable por medio de una máquina de Turing coinciden. Natural¬ 
mente a la luz de esto la Tesis de Turing resulta ser equivalente a la de Church. 

Finalmente, cabe reseñar el trabajo de E. Post. Este estaba interesado en marcar la frontera 
entre lo que se puede hacer en matemáticas simplemente por procedimientos formales y lo que 
depende de la comprensión y el entendimiento. De esta forma, Post formula un modelo de pro¬ 
cedimiento efectivo a través de los llamados sistemas deductivos normales. Estos son sistemas 
puramente formales en los que puede ‘deducirse’ sucesiones finitas de símbolos como conse¬ 
cuencia de otras sucesiones finitas de símbolos por medio de un tipo normalizado de reglas y a 
partir de un conjunto de axiomas. Así pues, dada una sucesión finita de símbolos como entrada, 
las reglas permiten convertirla en una sucesión finita de salida. En su artículo, Post demostró 
resultados de incompletitud e indecibilidad en estos sistemas. 

Los resultados hasta ahora citados, se refieren a funciones totales. La existencia de algo¬ 
ritmos que con determinadas entradas nunca terminan, condujo de forma natural a considerar 
funciones parciales. Kleene fué el primero en hacer tal consideración en 1938. El estudio de 
estas funciones ha mostrado la posibilidad de generalizar todos los resultados anteriores a fun¬ 
ciones parciales. Por otro lado, el estudio de las funciones parciales calculables ha resultado 
esencial para el posterior desarrollo de la materia. 

Posteriormente, se demostró la equivalencia entre lo que se podía calcular mediante una 
máquina de Turing y lo que se podía calcular mediante un sistema formal en general. 

A la vista de estos resultados, la Tesis de Church-Turing es aceptada como un axioma en la 
teoría de la computación, y ha servido como punto de partida en la investigación de los proble¬ 
mas que se pueden resolver mediante un algoritmo. 

Problemas no computables 

Usando la codificación de Godel, se demostró que era posible construir una máquina de 
propósito general, es decir, capaz de resolver cualquier problema que se pudiese resolver me¬ 
diante un algoritmo. Dicha máquina tendría como entrada el entero que codificaría el algoritmo 
solución del problema y la propia entrada del problema, de tal forma, que la máquina aplicaría 
el algoritmo codificado a la entrada del problema. Esta hipotética máquina puede considerarse 
como el padre de los actuales ordenadores de proposito general. 

Una de las cuestiones más estudiadas en la teoría de la computabilidad ha sido la posibi¬ 
lidad de construir algoritmos que nos determinen si un determinado algoritmo posee o no una 
determinada propiedad. Así, sería interesante responder de forma automática a cuestiones como: 

- ¿Calculan los algoritmos A y B la misma función? (Problema de la equivalencia) 

- ¿Parará el algoritmo A para una de sus entradas? (Problema de la parada) 

- ¿Parará el algoritmo A para todas sus entradas? (Problema de la totalidad) 

- ¿Calcula el algoritmo A la función f? (Problema de la verificación?) 
etc ... 

En un principio se fueron obteniendo demostraciones individuales de la no computabilidad 
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de cada una de estas cuestiones, de forma que se tenía la sensación de que casi cualquier pregunta 
interesante acerca de algoritmos era no computable. 

A pesar de esto, y como consecuencia de la existencia de un programa universal hay otras 
muchas cuestiones interesantes que se han demostrado computables. 

El identificar los problemas que son computables y los que no lo son tiene un considerable 
interés, pues indica el alcance y los límites de la computabilidad, y así demuestra los límites 
teóricos de los ordenadores. Además de las cuestiones sobre algoritmos, se han encontrado nu¬ 
merosos problemas menos "generales"que han resultado ser no computables. Como ejemplo 
citamos: 

- Décimo problema de Hilbert. Una ecuación diofántica es la ecuación de los ceros enteros de un 
polinomio con coeficientes enteros. Se pregunta si hay un procedimiento efectivo que determine 
si una ecuación diofántica tiene o no solución. 

Por otro lado, son muchos los problemas interesantes que se han demostrado computables. 
Todas las funciones construidas por recursividad primitiva o minimalización a partir de funcio¬ 
nes calculables resultan ser calculables como consecuencia de los trabajos de Church y Turing. 
Pero además, otras funciones más complejamente definidas también son computables. Como 
ejemplo más interesante de aplicación de este tipo de recursión tenemos la función de Acker- 
mann \|/: 


y(0,y)=y+l; 

Y(*+l,0) = y(x, l); 

v(*+ l ,y+ 1) = v(u v(*+ i,y))- 


1.2. Diferentes Modelos de Computación 

Consideraremos las Ciencias de la Computación como un cuerpo de conocimiento cuyo 
principal objetivo es la resolución de problemas por medio de un ordenador. Podemos citar las 
siguientes definiciones: 

a) La ACM (Asociation Computing Machinering): 

‘la disciplina Ciencias de la Computación es el estudio sistemático de los procesos algorít¬ 
micos que describen y transforman información: teoría, análisis, diseño, eficiencia, implemen- 
tación, y aplicación.’ 

b) Norman E. Gibbs y Alien B. Tucker (1986)indican que: ‘no debemos entender que el objetivo 
de las Ciencias de la Computación sea la construcción de programas sino el estudio sistemático 
de los algoritmos y estructura de datos, específicamente de sus propiedades formales’. 

Para ser más concretos (A. Berztiss 1987), vamos a considerar a las C.C. como un cuerpo de 
conocimiento cuyo objetivo es obtener respuestas para las siguientes cuestiones: 
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A) ¿Qué problemas se pueden resolver mediante un ordenador?. 

B) ¿Cómo puede construirse un programa para resolver un problema?. 

C) ¿Resuelve realmente nuestro programa el problema?. 

D) ¿Cuanto tiempo y espacio consume nuestro problema?. 

Analizando en profundidad los 4 puntos anteriores llegaremos a descubrir explícitamente los 
diferentes contenidos abarcados por las C.C. 

El planteamiento de la primera cuestión nos conduce a precisar el concepto de problema y 
de lo que un ordenador es capaz de realizar. 

Durante muchos años se creyó que si un problema podía enunciarse de manera precisa, 
entonces con suficiente esfuerzo y tiempo sería posible encontrar un ‘algoritmo’ o método para 
encontrar una solución (o tal vez podría proporcionarse una prueba de que tal solución no existe). 
En otras palabras, se creía que no había problema que fuera tan intrínsecamente difícil que en 
principio nunca pudiera resolverse. 

Uno de los grandes promotores de esta creencia fué el matemático David Hilbert (1862- 
1943), quien en un congreso mundial afirmó: 

"Todo problema matemático bien definido debe ser necesariamente susceptible de un plan¬ 
teamiento exacto, ya sea en forma de una respuesta real a la pregunta planteada o debido a la 
constatación de la imposibilidad de resolverlo, a lo que se debería el necesario fallo de todos los 
intentos... " 

El principal obstáculo que los matemáticos de principios de siglo encontraban al plantearse 
estas cuestiones era concretar con exactitud lo que significa la palabra algoritmo como sinónimo 
de método para encontrar una solución. La noción de algoritmo era intuitiva y no matemática¬ 
mente precisa. 

Las descripciones dadas por los primeros investigadores tomaron diferentes formas, que pue¬ 
den clasificarse ampliamente del siguiente modo: 

(a) máquinas computadoras abstractas (definidas de modo preciso), 

(b) construcciones formales de procedimientos de cómputo, y 

(c) construcciones formales productoras de clases de funciones. 

Las dos primeras caracterizaciones se refieren a la propia noción de algoritmo (en princi¬ 
pio no hay gran diferencia entre ambas ). La última dá descripciones de la clase de funciones 
computables mediante un algoritmo. 

Ejemplos de (a) son los Autómatas y las máquinas de Turing, (diseñadas por Turing en los 
años 30). Un ejemplo de (b) son los sistemas de Thue. Por último, las funciones recursivas 
constituyen el ejemplo clásico de (c). 

El resultado crucial es que las diversas caracterizaciones de las funciones (parciales) com¬ 
putables mediante un algoritmo condujeron todas a una misma clase, a saber, la clase de las 
funciones parciales recursivas. Esto es algo suceptible de demostración, y que ha sido demostra¬ 
do. Lo que no es suceptible de demostración es que la clase de las funciones parciales recursivas 
coincida con la clase de las funciones computables mediante un algoritmo. No obstante, a la luz 
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de las evidencias a favor y de la falta de evidencias en contra, aceptamos la Tesis de Church que 
afirma la equivalencia de ambas clases. 

Se clasifican los problemas según que siempre sea posible encontrar la solución por medio 
de un algoritmo (problemas computables) ó que no existan algoritmos que siempre produzcan 
una solución (problemas no computables). 

Surge de modo inmediato la cuestión B) de como diseñar un programa (algoritmo especifi¬ 
cado para poder ser ejecutado por un ordenador) que resuelva un problema dado. En la primera 
época del desarrollo informático los programas dependían intrínsecamente del ordenador utili¬ 
zado, pues se expresaban en lenguaje máquina, directamente interpretable por el ordenador. 

Surgió entonces la necesidad de idear otros mecanismos para construir y expresar los pro¬ 
gramas. El hilo conductor de tales mecanismos fué la abstracción: separar el programa del orde¬ 
nador y acercarlo cada vez más al problema. 

Los subprogramas empezaron ya a usarse a principios de los 50, dando lugar posteriormente 
al primer tipo de abstracción, la procedimental. A principios de los 60, se empezaron a entender 
los conceptos abstractos asociados a estructuras de datos básicas pero aún no se separaban los 
conceptos de las implementaciones. Con el nacimiento en esta época de los primeros lenguajes 
de alto nivel, Fortran p.ej., se llegó a la abstracción sintáctica, al abstraerse la semántica de las 
expresiones matemáticas y encapsular el acceso a ellas a través de la sintaxis propia del lenguaje. 
En cualquier caso con el desarrollo de estos lenguajes de alto nivel se solventaron los problemas 
de flexibilidad en la comunicación con el ordenador, y se empezaron a estudiar los algoritmos 
de forma independiente del ordenador concreto en que se probaran y del lenguaje concreto en 
que se expresaran. 

Aparece la necesidad de traducir los programas escritos en lenguajes de alto nivel al lenguaje 
máquina, de forma automática, y se buscan máquinas o procedimientos que puedan reconer el 
léxico y la sintáxis de dichos lenguajes. 

Hay que comentar que no hay un algoritmo para enseñar a diseñar algoritmos, y que muchas 
veces el proceso de construcción puede llegar a ser muy poco disciplinado. No obstante, existen 
técnicas de diseño de algoritmos, que vienen a ser modelos abstractos de los mismos aplicables 
a gran variedad de problemas reales. 

Una vez construido un programa para un problema, surge la cuestión C) de si lo resuelve 
realmente. Normalmente los programadores prueban sus programas sobre una gran cantidad de 
datos de entrada para descubrir la mayoría de los errores lógicos presentes, aunque con este 
método (al que suele denominarse de prueba y depuración) no se puede estar completamen¬ 
te seguro de que el programa no contiene errores. Necesitaríamos para realizar la verificación 
formal, reglas que describan de forma precisa el efecto que cada instrucción tiene en el estado 
actual del programa, para, aplicando dichas reglas demostrar rigurosamente que lo que hace el 
programa coincide con sus especificaciones. En cualquier caso y cuando la prueba formal resulte 
muy complicada, podemos aumentar la confianza en nuestro programa realizando en el mismo 
los "tcstcuidadosos de que hablábamos al principio. 
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Alcanzado este punto, ya tenemos un programa que en principio es solución de un problema. 
Se plantea entonces la duda de que hacer en caso de que para el mismo problema seamos capaces 
de construir otro programa que también lo resuelva. ¿Cómo decidirnos por una u otra solución? 
o más aún, ¿qué ocurre si el programa aún siendo correcto consume demasiados recursos y es 
inaceptable?. La respuesta viene dada a través del punto D) en nuestro recorrido: el análisis del 
tiempo y espacio que necesita una solución concreta; en definitiva, el estudio de la eficiencia de 
los programas, midiendo la complejidad en espacio, por el número de variables y el número y 
tamaño de las estructuras de datos que se usan, y la complejidad en tiempo por el número de 
acciones elementales llevadas a cabo en la ejecución del programa. 

Los problemas computables fueron entonces clasificados en dos tipos: problemas eficiente¬ 
mente computables, para los que existía un algoritmo eficiente; y problemas intratables, para los 
que no existen algoritmos eficientes. La existencia de problemas intratables no ha sido probada, 
si bién se han encontrado muchas evidencias a su favor. 

Otra clase de problemas a considerar es la clase NP de los problemas para los que exis¬ 
tia un algoritmo no determinístico en tiempo polinomial, y dentro de ella, los problemas NP- 
completos. 

Los intentos (desde los años 40) de construir máquinas para modelizar algunas de las funcio¬ 
nes del cerebro biológico, ha permitido desarrollar máquinas capaces de 'aprender’ (y reprodu¬ 
cir) funciones (o sistemas) cuya forma (o comportamiento) se desconoce, pero sí conocemos una 
serie de ejemplos que reflejan esta forma (o comportamiento). Estas máquinas llamadas Redes 
Neuronales Artificiales también aportan su granito de arena al desarrollo de la computación. 

A menudo se utiliza la técnica de reducir un problema a otro para comprobar si tiene o no 
solución efectiva. La estratégia en el caso de la respuesta negativa es la siguiente, si se reduce de 
forma efectiva un problema sin solución efectiva a otro problema (mediante una función calcu¬ 
lable), entonces este nuevo problema tampoco tendrá solución efectiva. La razón es muy simple, 
si tuviese solución efectiva, componiendo el algoritmo solución con el algoritmo de transforma¬ 
ción obtendríamos una solución para el problema efectivamente irresoluble. En sentido inverso, 
si se reduce un problema a otro para el que se conoce una solución efectiva, entonces compo¬ 
niendo se obtiene una solución para el primer problema. Esta técnica es muy útil y se utiliza 
a menudo. Por otro lado, esta misma técnica es muy empleada en el campo de la complejidad 
algorítmica. 

La Complejidad Algorítmica trata de estudiar la relativa dificultad computacional de las 
funciones computables. Rabin (1960) fué de los primeros en plantear la cuestión ¿Qué quiere 
decir que / sea más difícil de computar que gl 

J. Hartmanis and R.E. Stearns, en On the computational complexity of algorithms (1965) 
introducen la noción fundamental de medida de complejidad definida como el tiempo de com¬ 
putación sobre una máquina de Turing multicinta. 

Después surge la definición de funciones computables en tiempo polinomial, y se establece 
una jerarquía de complejidad, los problemas NP, NP-duros y NP-completos. De todas formas, el 
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perfil de la plaza no se ocupa directamente de este problema que además se estudia ampliamente 
en otras materias y asignaturas del curriculum de Informática. 

1.2.1. Autómatas y Lenguajes 

El desarrollo de los ordenadores en la década de los 40, con la introducción de los progra¬ 
mas en la memoria principal, y posteriormente con los lenguajes de programación de alto nivel, 
propician la distinción entre lenguajes formales, con reglas sintácticas y semánticas rígidas, con¬ 
cretas y bién definidas, de los lenguajes naturales como el inglés, donde la sintaxis y la semántica 
no se pueden controlar fácilmente. Los intentos de formal i z ar los lenguajes naturales, lleva a la 
construcción de gramáticas, como una forma de describir estos lenguajes, utilizando para ello 
reglas de producción para construir las frases del lenguaje. Se puede entonces caracterizar un 
Lenguaje, mediante las reglas de una gramática adecuada. 

Los trabajos de McCulloch y Pitts (1943) describen los cálculos lógicos inmersos en un 
dispositivo (neurona artificial) que habían diseñado para simular la actividad de una neurona 
biológica. El dispositivo recibía o no, una serie de impulsos eléctricos por sus entradas que se 
ponderaban, y producía una salida binaria (existe pulso eléctrico o no). Las entradas y salidas se 
podían considerar como cadenas de 0 y 1, indicando entonces la forma de combinar la cadena de 
entrada para producir la salida. La notación utilizada es la base para el desarrollo de expresiones 
regulares en la descripción de conjuntos de cadenas de caracteres. 

C. Shannon (1948) define los fundamentos de la teoría de la información, y utiliza esquemas 
para poder definir sistemas discretos, parecidos a los autómatas finitos, relacionándoloss con 
cadenas de Markov, para realizar aproximaciones a los lenguajes naturales. 

J. Von Neumann (1948) introduce el t’ermino de teoría de autómatas, y dice sobre los traba¬ 
jos de McCulloch-Pitts: “.. el resultado más importante de McCulloch-Pitts, es que cualquier 
funcionamiento en este sentido, que pueda ser definido en todo, lógicamente, estrictamente y 
sin ambigüedad, en un número finito de palabras, puede ser realizado también por una tal red 
neuronal formal ” 

La necesidad de traducir los algoritmos escritos en lenguajes de alto nivel al lenguaje má¬ 
quina, propicia la utilización de máquinas como los autómatas de estados finitos, para reconocer 
si una cadena determinada pertenece (es una frase de) a un lenguaje concreto, usando para ello 
la función de transición de estados, mediante un diagrama de transición o una tabla adecuada. 
Tenemos así otra forma de caracterizar los lenguajes, de acuerdo con máquinas automáticas que 
permitan reconocer sus frases. 

S.C. Kleene, en 1951, realiza un informe (solicitado por la RAND Corporation) sobre los 
trabajos de McCulloch-Pitts, que se publica en 1956. En este informe, Kleene demuestra la 
equivalencia entre lo que él llama "dos formas de definir una misma cosa", que son los sucesos 
regulares (que se pueden describir a partir de sucesos bases y los operadores unión, concatena¬ 
ción e iteración (*) ), es decir, expresiones regulares, y sucesos especificados por un autómata 
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finito. 

Rabin y Scott (1960) obtienen un modelo de computador con una cantidad finita de memoria, 
al que llamaron autómata de estados finitos. Demostraron que su comportamiento posible, era 
básicamente el mismo que el descrito mediante expresiones regulares, desarrolladas a partir de 
los trabajos de McCulloch y Pitts. 

No obstante lo dicho, para un alfabeto concreto, no todos los lenguajes que se pueden cons¬ 
truir son regulares. Ni siquiera todos los interesantes desde el punto de vista de la construcción 
de algoritmos para resolver problemas. Hay entonces muchos problemas que no son calcula¬ 
bles con estos lenguajes. Esto pone de manifiesto las limitaciones de los autómatas finitos y 
las gramáticas regulares, y propicia el desarrollo de máquinas reconocedoras de otros tipos de 
lenguajes y de las gramáticas correspondientes, asociadas a los mismos. 

En 1956, la Princenton Univ. Press publica el libro Autómata Studies, editado por C. Shannon 
y J. McCarthy, donde se recogen una serie de trabajos sobre autómatas y lenguajes formales. D. 
A. Huffman (1954) ya utiliza conceptos como estado de un autómata y tabla de transiciones. 

N. Chomsky (1956) propone tres modelos para la descripción de lenguajes, que son la base 
de su futura jerarquía de los tipos de lenguajes, que ayudó también en el desarrollo de los lengua¬ 
jes de programación. Para ello intentó utilizar autómatas para extraer estructuras sintácticas (“... 
el inglés no es un lenguaje de estados finitos”) y dirige sus estudios a las gramáticas, indicando 
que la diferencia esencial entre autómatas y gramáticas es que la lógica asociada a los autómatas 
(p.e., para ver la equivalencia entre dos de ellos) es Decidióle, mientras que la asociada a las 
gramáticas no lo es. 

Desarrolla el concepto de gramática libre del contexto, en el transcurso de sus investigaciones 
sobre la sintáxis de los lenguajes naturales. 

Backus y Naur desarrollaron una notación formal para describir la sintáxis de algunos len¬ 
guajes de programación, que básicamente se sigue utilizando todavía, y que podía considerarse 
equivalente a las gramáticas libres del contexto. 

Consideramos entonces los lenguajes libres (independientes) del contexto, y las gramáticas 
libres del contexto y los autómatas con pila, como forma de caracterizarlos y manejarlos. Los 
distintos lenguajes formales que se pueden construir sobre un alfabeto concreto pueden clasifi¬ 
carse en clases cada vez más amplias que incluyen como subconjunto a las anteriores, de acuerdo 
con la jerarquía establecida por Chomsky en los años 50. 

Se puede llegar así, de una forma casi natural a considerar las máquinas de Turing, estable¬ 
cidas casi 20 años antes, como máquinas reconocedoras de los lenguajes formales dependientes 
del contexto o estructurados por frases, e incluso a interpretar la Tesis de Turing como que ün 
sistema computacional nunca podrá efectuar un análisis sintáctico de aquellos lenguajes que 
están por encima de los lenguajes estructurados por frases, según la jerarquía de Chomsky". 

En consecuencia, podemos utilizar la teoría de autómatas y los conceptos relativos a gramá¬ 
ticas sobre distintos tipos de lenguajes, para decidir (si se puede) si una función (o problema) 
es calculable, en base a que podamos construir un algoritmo solución mediante un lenguaje que 
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puede ser analizado mediante alguna máquina de las citadas anteriormente. 

Los temas sobre autómatas, computabilidad, e incluso la complejidad algorítmica fueron 
incorporándose a los curriculum de ciencias de la computación de diferentes universidades, me¬ 
diada la década de los 60. Esta incorporación puso de manifiesto que las ciencias de la computa¬ 
ción habían usado gran cantidad de ideas de muy diferentes campos para su desarrollo, y que la 
investigación sobre aspectos básicos podía cooperar y aumentar los avances de la computación. 


1.3. Lenguajes y Gramáticas. Aspectos de su traducción 

Una idea básica en programación es la enorme diferencia entre los lenguajes naturales (LN) 
y los lenguajes de programación (LP), fundamentalmente porque los LP tienen unas reglas de 
sintáxis y de semántica mucho más rígidas, lo que les hace manejables en los computadores. 

En los LN, las reglas gramaticales se desarrollan para reglamentar"de alguna forma la propia 
evolución del lenguaje. Se trata pues de "explicarla estructura del lenguaje, y no delimitarla. 
Esto obliga a reglas muy complejas y que se quedan obsoletas rápidamente. 

Los lenguajes más formalizados (LF) como los lengujaes de progrmación o el lenguaje mate¬ 
mático, tienen unas estructuras claramente definidas y determinadas por sus reglas gramaticales 
(sintácticas y semánticas). Esto ha posibilitado y propiciado la construcción de traductores auto¬ 
máticos para estos lenguajes. 

En el proceso de traducción que realizan los compiladores, la primera tarea que se realiza, es 
la identificación de tokens como bloques u objetos individuales contenidos en el "diccionario"del 
lenguaje (p.e., identificadores, palabras claves, operadores, .... ). Esto lo realiza un módulo del 
compilador que es el analizador de léxico, que transforma el programa fuente, en una secuencia 
de tokens representando cada uno un solo objeto. 

El siguiente paso, realizado por el analizador sintáctico, es identificar los tokens que forman 
parte de cada instrucción y ver que estas estén correctamente escritas. El tercer paso es generar 
el código con el generador de código. 

Los dos primeros pasos requieren imperiosamente unas reglas gramaticalesglaramente de¬ 
finidas, en las que apoyarse para la automatización del proceso de traducción. Generalmente 
se utilizan en estas tares, máquinas (o algoritmos) como los autómatas, que estudiaremos más 
adelante. 

Vamos a precisar previamente, los conceptos básicos relativos a Lenguajes y Gramáticas 
formales. 

1.3.1. Alfabetos y Palabras 

Los dispositivos que vamos a estudiar trabajan con símbolos y cadenas (o palabras) funda¬ 
mentalmente. En este apartado vamos a definir de forma precisa estos conceptos. 
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Definición 1 Un alfabeto es un conjunto finito A. Sus elementos se llamarán símbolos o letras. 

Para notar los alfabetos, en general, usaremos siempre que sea posible las primeras letras en 
mayúsculas: A,B,C, _Para los símbolos trataremos de emplear las primeras letras en minús¬ 

culas: a, b, c,... o números. 

Las siguientes son algunas normas de notación que respetaremos en lo posible a lo largo del 
curso. En casos particulares en los que sea imposible seguirlas lo indicaremos explicitamente. 

Ejemplo 1 A — {0,1} es un alfabeto con símbolos 0 y 1. 

También es un alfabeto = {< 0,0 >,< 0,1 >,< 1,0 >, < 1,1 >} con símbolos < 0,0 > 
,<0,1 >,< 1,0 > y < 1,1 >. En este caso no hay que confundir los símbolos del alfabeto 
B con los síimbolos del lenguaje (o más precisamente meta-lenguaje) que usamos para expre¬ 
sarnos todos los días. Son dos cosas totalmente distintas. Nosotros para comunicarnos usamos 
un lenguaje que tiene unos símbolos que son las letras del alfabeto latino, los números, las le¬ 
tras del alfabeto griego, y una serie de símbolos especiales propios del lenguaje matemático 
(el meta-lenguaje). Con este lenguaje también definimos los conceptos de alfabeto y símbolo. 
Ahora bién, los símbolos de un lenguaje no tienen que ser algunos de los usados en el meta- 
lenguaje, sino que cada uno puede estar formado por 0, 1 o más símbolos del metalenguaje. De 
hecho como en este último caso (lenguaje B), un símbolo del alfabeto definido está formado por 
varios símbolos del metalenguaje. Para que esto no de lugar a confusión, siempre que ocurra 
una situación similar, encerraremos los símbolos entre ángulos <...>. Esto indicará que todo 
lo que aparece es un único símbolo. 

Definición 2 Una palabra sobre el alfabeto A es una sucesión finita de elementos de A. Es decir 
u es una palabra sobre A, si y solo si U — a\.. .a n donde ai e A, Vi = 1,..., n. 

Por ejemplo, si A = {0,1} entonces 0111 es una palabra sobre este alfabeto. 

El conjunto de todas las palabras sobre un alfabeto A se nota como A*. 

Para las palabras usaremos, en lo posible, las últimas letras del alfabeto latino en minúsculas: 

u,v,x,y,z,.... 

Definición 3 Si u G A*, entonces la logitud de la palabra u es el número de símbolos de A que 
contiene. La longitud de u se nota como \u\. Es decir si u — a\... a n , entonce \u\ = n. 

Definición 4 La palabra vacía es la palabra de longitud cero. Es la misma para todos los alfa¬ 
betos, y se nota como £. 

El conjunto de cadenas sobre un alfabeto A excluyendo la cadena vacía se nota como A + . 
Usaremos indistintamente palabra o cadena. Si no hay confusión, la palabra formada por un 
solo símbolo se representa por el propio símbolo. 

La operación fundamental en el conjunto de las cadenas A* es la concatenación. 
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Definición 5 Si u,v E A*, u = a\... a n , v = b\... b,„ se llama concatenación de u y v a la cadena 
u.v (o simplemente uv) dada por a\... a n b\... b m . 

La concatenación tiene las siguientes propiedades: 

1. \u.v\ = |«| + |v|, \/u,vEA* 

2. Asociativa.- u.(v.w) — (w.v).w, Wu,v,wEA* 

3 . Elemento Neutro.- u.e = e.u — u, \/uEA* 

Los propiedades asociativa y elemento neutro dotan al conjunto de las cadenas con la opera¬ 
ción de concatenación de la estructura de monoide. La propiedad conmutativa no se verifica. 

Consideramos la iteración n-sima de una cadena como la concatenación con ella misma n 
veces, y se define de forma recursiva: 

Definición 6 Si u EA* entonce 


- u ,+1 — u'.u , Vi > 0 

Definición 7 Si u — a\... a n E A*, entonces la cadena inversa de u 
es la cadena u~ l = a n . ..ai E A*. 

1.3.2. Lenguajes 

Definición 8 Un lenguaje sobre el alfabeto A es un subconjunto del conjunto de las cadenas 
sobre A: L C A*. 

Los lenguajes los notaremos con las letras intermedias del alfabeto latino en mayúsculas. 

Ejemplo 2 Los siguientes son lenguajes sobre un cdfabeto A, cuyo contenido asumimos conocer 
claramente: 

■ L\ = {a,b,e}, símbolos a, b y la cadena vacía 

■ Lo — {a'b 1 | i = 0,1,2,...}, palabras formadas de una sucesión de símbolos a, seguida de 
la misma cantidad de símbolos b. 

■ L 3 = {iiu 1 | u E A*}, palabras formadas con símbolos del alfabeto A y que consisten de 
una palabra, seguida de la misma palabra escrita en orden inverso. 
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m L 4 — {a n | n = 1,2,3 ,..palabras que tienen un número de símbolos a que sea cuadrado 
perfecto, pero nunca nulo. 

Aparte de las operaciones de unión e intersección de lenguajes, dada su condición de con¬ 
juntos existe la operación de concatenación. 

Definición 9 If L\.Ln son dos lenguajes sobre el alfabeto A, la concatenación de estos dos 
lenguajes es el que se obtiene de acuerdo con la siguiente expresión, 

L\L2 = {«i «2 | «i G E \, Un G L2} 

Ejemplo 3 Si L\ — {O'L : i > 0}, L 2 = {1*0* : i > 0} entonces, 

L\L 2 = {0 ¿ 1 1 1 Hfi : i. j > 0} 


Propiedades: 

■ L0 = 0L = 0 (0 es el Lenguaje que contiene 0 palabras) 

■ Elemento Neutro.- {e}L = L{e} = L 

■ Asociativa.- L\(L 2 Lf) = ( L\Lrf)L 3 

La iteración de lenguajes se define como en las palabras, de forma recursiva: 

Definición 10 Si L es un lenguaje sobre el alfabeto A, entonces la iteración de este lenguaje se 
define de acuerdo con las siguientes expresiones recursivas, 

¿° = {£} 

L i+l — L'L 

Definición 11 Si L es un lenguaje sobre el alfabeto A, la clausura de Kleene de L es el lenguaje 
obtenido de acuerdo con la siguiente expresión: 

£* = U l¿ 

;>0 

Definición 12 Si L es un lenguaje sobre el alfabeto A, entoces L + es el lenguaje dado por: 

L+ = U L ¡ 

í> 1 
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Propiedades: 

■ L + — L* si £ G L 
. L+ = L* - {£} si £ £ L 

Ejemplo 4 Si L— {0,01}, entonces, L* — Conjunto de palabras sobre {0, 1} en las que un uno 
va siempre precedido de un cero. 

Por otra parte, L + = Conjunto de palabras sobre {0, 1} en las que un uno va siempre pre¬ 
cedido de un cero y distintas de la palabra vacía. 

Definición 13 Si L es un lenguaje, el lenguaje inverso de L es el lenguaje dado por: 

L 1 = {u | i / -1 G L} 

Definición 14 Si L es un lenguaje sobre el alfabeto A, entonces la cabecera de L es el lenguaje 
dado por 


CAB(L) — {u | u G A* y 3v G A* tal que uv G L} 

Es decir, la CAB(L) contiene todas las palabras del lenguaje y aquellas otras que tengan 
como primeros caracteres, alguna palabra del mismo. 

Ejemplo 5 Si L— {O'E : i > 0}, entonces CAB(L) = {O'l- 7 : i > j > 0} . 

Definición 15 Si A\ y Ao son dos alfabetos, una aplicación 

h:AX^Al 

se dice que es un homomorfismo si y solo si 

h(uv) = h(u)h(v) 


Consecuencias: 

■ h(é) = £ 

■ h(a\.. .a n ) =h{a\) .. .h(a n ) 

Ejemploó Sí Ai = { 0 , 1,2, 3,4, 5, 6 , 7 , 8,9},A 2 = { 0 , 1} 
la siguiente aplicación es un homorfismo 
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h( 2 ) = 0010 , 
h{ 6 ) = 0110 , 


h(3) =0011 
/i(7) =0111 


/i(0)=0000, fi(l)=0001, 

¿(4) =0100, h( 5) = 0101, 
h( 8) = 1000 h( 9) = 1001 

Ejemplo 7 ■ Sz A es un afabeto, la aplicación que transforma cada palabra u G A* en su 

inversa no es un homomorfismo de A* en A*, ya que la transformación no se hace símbolo 
a símbolo. 

■ La transformación que a cada palabra sobre {0,1}* le añade 00 al principio y 11 al 
final no es un homomorfismo. Si 0 se transforma en 00011, entonces 00 se debería de 
transformar en 0001100011 si fuese un homomorfismo, y en realidad se transforma en 
000011 . 

1.3.3. Gramáticas Generativas 

Desde un punto de vista matemático una gramática se define de la siguiente forma: 

Definición 16 Una gramática generativa es un cuadrupla ( V , T, P. S ) en la que 

- V es un alfabeto, llamado de variables o símbolos no terminales. Sus elementos se suelen 
representar con letras mayúsculas. 

- T es un alfabeto, llamado de símbolos terminales. Sus elementos se suelen representar 
con letras minúsculas. 

- P es un conjunto de pares (a, (3), llamados reglas de producción, donde a. [3 G (V IJT 'f y 
a contiene, al menos un símbolo de V. 

El par (a, (3) se suele representar como a —> [3. 

- S es un elemento de V, llamado símbolo de partida. 

La razón de notar los elementos del alfabeto V con letras mayúsculas es para no confundirlos 
con los símbolos terminales. Las cadenas del alfabeto (V U T) se notan con letras griegas para 
no confundirlas con las cadenas del alfabeto T, que seguirán notándose como de costumbre: 
u,v,x.... 

Ejemplo 8 Sea la gramática (V, T. P.S) dada por los siguientes elementos, 


V = \E) 

T a,b,c} 
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- P está compuesto por las siguientes reglas de producción 

E-^E+E, e^e*e, £-(£), 
E —> a, E —> E —> c 


- 5 = £ 

Una gramática se usa para generar las distintas palabras de un determinado lenguaje. Esta 
generación se hace mediante una aplicación sucesiva de reglas de producción comenzando por 
el símbolo de partida S. Las siguientes definiciones expresan esta idea de forma más rigurosa. 

Definición 17 Dada una gramática G — (V, T. P. S ) y dos palabras oc. P G (V U T)*, decimos que 
P es derivable a partir de a en un paso (a => p) si y solo si existe una producción y —> cp tal 
que 


■ y es una subcadena de a. 

■ p se puede obtener a partir de a, cambiando la subcadena yfor cp. 

Ejemplo 9 Placiendo referencia a la gramática del ejemplo anterior, tenemos las siguientes 
derivaciones, 


E => E +E (E) +E => (£) + (£) => (£*£) + (£) => (E*E) + (E*E) 

Definición 18 Dada una gramática G — ( V , T. P, S ) y dos palabras a, P G (V U T)*, decimos que 
p es derivable de a (a ==>■ p), si y solo si existe una sucesión de palabras yi,... ,y„ (n > 1) 
tales que 

a = yi y 2 y„ = p 

Ejemplo 10 En el caso anterior podemos decir que (E *E) + (E *E) es derivable a partir de 
E: 

E^ (E*E) + (E*E) 


Definición 19 Se llama lenguaje generado por una gramática G = (V. T. P.S) al conjunto de 
cadenas formadas por símbolos terminales y que son derivables a partir del símbolo de partida. 
Es decir, 


L(G) = {ueT* 
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Ejemplo 11 En el caso de la gramática de los ejemplos anteriores (E * E) + (E * E) no per¬ 
tenece cd lenguaje generado por G, ya que hay símbolos que no son terminales. Sin embargo, 
(a + c)*(a + b ) si pertenece a L(G), ya que se puede comprobar que es derivable a partir de E 
(símbolo de partida) y solo tiene símbolos terminales. 

Si en una gramática comenzamos a hacer derivaciones a partir del símbolo original S, dicha 
derivación acabará cuando solo queden símbolos terminales, en cuyo caso la palabra resultante 
pertenece a L(G), o cuando queden variables pero no se pueda aplicar ninguna regla de pro¬ 
ducción, en cuyo caso dicha derivación no puede llevar a ninguna palabra de L(G). En general, 
cuando estemos haciendo una derivación puede haber más de una regla de producción aplicable 
en cada momento. 

Cuando no sea importante distinguir si la derivación de una palabra en una gramática se 
haya realizado en uno o varios pasos, entonces eliminaremos la * del símbolo de derivación. 
Así, escribiremos a p, en lugar de a p. 

Ejemplo 12 Sea G = (V,7. P.S) una gramática, donde V — {S.A.B}, T = {a , b}, las reglas de 
producción son 

S —> aB, S —>■ bA , A —> a, A —> aS, 

A —» bAA. B —> b, B —> bS , B —> aBB 

y el símbolo de partida es S. 

Esta gramática genera el lenguaje 

L(G) — {u | u G {a,b} + y N a (u) = N¡,(u)} 

donde N a (u ) y N¡,(u ) son el número de apariciones de símbolos a y b, en u, respectivamente. 
Esto es fácil de ver interpretando que, 

- S genera (o produce) palabras con igual número de a que de b. 

- A genera palabras con una a de más. 

- B produce palabras con una b de más. 

- S genera palabras con igucd número de a que de b. 

Hay que demostrar que todas las pcdabras del lenguaje tienen el mismo número de a que 
de b, hay que probar que todas las palabras generadas cumplen esta condición y que todas las 
palabras que cumplen esta condición son generadas. 

Para lo primero basta con considerar el siguiente razonamiento. Supongamos N a mÍOC) y 
Nb i «(a) que son el número de a + el número de A en a y el número de b + el número de B en 
a, respectivamente. Entonces, 
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■ Cuando se empieza a generar una palabra, comenzamos con S y tenemos la igualdad 
N a+A (S)=N b+B (S)= 0. 

■ También se puede comprobar que si a' se obtiene de a en un paso de derivación y 
Nc+a(u) = N b+B (a), entonces N ci +a{v!) = N b+B ( a') 

■ Si la condición de igualdad de N ü +a y N b ¡ h se verifica al principio y, si se verifica antes 
de un paso, entonces se verifica después de aplicarlo, necesariamente se verifica al final 
de la derivación. Si hemos derivado u, entonces N ü +a (u) = N¡, t B {u). 

■ Como u no tiene variables, entonces N ci+ a{u ) = N a (u) y N/, ¡ g(u) — N b (u), por lo tanto, 
N a (u) — N b {u), es decir si u es generada contiene el mismo número de a que de b. 

Para demostrar que todas las palabras del lenguaje son generadas por la gramática, damos 
el siguiente algoritmo que en n pasos es capaz de generar una palabra de n símbolos. El algo¬ 
ritmo genera las pcdabras por la izquierda obteniendo, en cada paso, un nuevo símbolo de la 
palabra a generar. 


■ Para generar una a 

• Si a último símbolo de la palabra, aplicar A —> a 

• Si no es el último símbolo 

o Si la primera variable es S aplicar S —> aB 

o Si la primera variable es B aplicar B —> aBB 

o Si la primera variable es A 

o Si haya más variables aplicar A —> a 
o Si no hay más, aplicar A —> aS 

■ Para generar una b 

• Si b último símbolo de la palabra, aplicar B b 

• Si no es el último símbolo 

o Si la primera variable es S aplicar S bA 

o Si la primera variable es A aplicar A —> bAA 

o Si la primera variable es B 

o Si haya más variables aplicar B b 
o Si no hay más, aplicar B bS 
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Las condiciones que garantizan que todas las palabras son generadas mediante este algo¬ 
ritmo son las siguientes: 

■ Las palabras generadas tienen primero símbolos terminales y después variables. 

■ Se genera un símbolo de la palabra en cada paso de derivación 

■ Las variables que aparecen en la palabra pueden ser: 

• Una cadena de A (si hemos generado más b que a) 

• Una cadena de B (si hemos generado más a que b) 

• Una S si hemos generado las mismas a que b 

■ Antes de generar el último símbolo tendremos como variables: 

• Una A si tenemos que generar a 

• Una B si tenemos que generar b 

■ Entonces aplicamos la primera opción para generar los símbolos y la palabra queda 
generada. 

Ejemplo 13 Sea G— ({S,X ,Y},{a,b,c},P,S) donde P tiene las reglas, 

S —> abe S -> aXbc Xb -> bX Xc -> Ybcc 

bY —> Yb aY aaX aY —>■ aa 

Esta gramática genera el lenguaje: {a n b n c n n = 1.2....}. 

Para ver esto obsedemos que S en un paso, puede generar abe ó aXbc. Así que abe G L(G). 
A partir de aXbc solo se puede relizar la siguiente sucesión de derivaciones, 

aXbc =>■ abXc =>■ abYbcc =>■ aYbbcc 
En este momento podemos aplicar dos reglas: 

- aY —> aa, en cuyo caso producimos ciabbcc = a 2 b 2 c 2 G L(G) 

- aY —> aaX, en cuyo caso producimos aaXbbcc 

A partir de aaXbbcc, se puede comprobar que necesariamente llegamos a a 2 Yb 3 c 3 . Aquí 
podemos aplicar otra vez las dos reglas de antes, produciendo a 3 b 3 c 3 ó a 3 Xb 3 c 3 . Así, mediante 
un proceso de inducción, se puede llegar a demostrar que las únicas palabras de símbolos 
terminales que se pueden llegar a demostrar son a"b n c n .n > 1. 
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1.3.4. Jerarquía de Chomsky 

De acuerdo con lo que hemos visto, toda gramática genera un único lenguaje, pero distintas 
gramáticas pueden generar el mismo lenguaje. Podríamos pensar en clasificar las gramáticas por 
el lenguaje que generan, por este motivo hacemos la siguiente definición. 

Definición 20 Dos gramáticas se dicen débilmente equivalentes si generan el mismo lenguaje. 

Sin embargo, al hacer esta clasificación nos encontramos con que el problema de saber si dos 
gramáticas generan el mismo lenguaje es indecidible. No existe ningún algoritmo que acepte 
como entrada dos gramáticas y nos diga (la salida del algoritmo) si generan o no el mismo 
lenguaje. 

De esta forma, tenemos que pensar en clasificaciones basadas en la forma de la gramática, 
más que en la naturaleza del lenguaje que generan. La siguiente clasificación se conoce como 
jerarquía de Chomsky y sigue esta dirección. 

Definición 21 Una gramática se dice que es de 

- Tipo 0 Cualquier gramática. Sin restricciones. 

- Tipo 1 Si todas las producciones tienen la forma 


CC1A0C2 —>• CC1PCC2 

donde 04 , 062 ,[3 G (V JT)*,A G V. y [3 f £, excepto posiblemente la regla S —> £, en cuyo 
caso S no aparece a la derecha de las reglas. 

- Tipo 2 Si cualquier producción tiene la forma 

A —> 06 

dodeA G V,06 G (Vur)*. 

- Tipo 3 Si toda regla tiene la forma 


A 


uB ó A 


u 


donde u G T* y A,B G V 

Definición 22 Un lenguaje se dice que es de tipo i{i — 0,1,2,3) si y solo si es generado por una 
gramática de tipo i. La clase o familia de lenguajes de tipo i se denota por L¡. 
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Figura 1.1: Estructura de las clases de lenguajes 


Se puede demostar que £3 C £ 2 Q L\ C Lq. 

Las gramáticas de tipo 0 se llaman también gramáticas con estructura de frase, por su ori¬ 
gen lingüístico. Los lenguajes aceptados por las gramáticas de tipo 0 son los recursivamente 
enumerables. 

Las gramáticas de tipo 1 se denominan dependientes del contexto. Los lenguajes aceptados 
por estas gramáticas son los lenguajes dependientes del contexto. 

Las gramáticas de tipo 2, así como los lenguajes generados, se llaman independientes del 
contexto. 

Las gramáticas de tipo 3 se denominan regulares o de estado finito. Los lenguajes aceptados 
por estas gramáticas se denominan conjuntos regulares. 

Los homorfismos son útiles para demostrar teoremas. 

Teorema 1 Para toda gramática G = (V, T. P. S ) podemos dar otra gramática G' — (V'. T. P'. S ) 
que genere el mismo lenguaje y tal que en la parte izquierda de las reglas solo aparezcan varia¬ 
bles. 


Demostración 

Si la gramática es de tipo 3 ó 2 no hay nada que demostrar. 

Si la gramática es de tipo 0 ó 1, entonces para cada a¡ G T introducimos una variable A, jL V . 
Entonces hacemos V' — V U {Ai,..., A/.}, donde k es el número de símbolos terminales. 

Ahora P' estará formado por las reglas de P donde, en todas ellas, se cambia a¡ por A ; . Aparte 
de ello añadimos una regla A, —> a¡ para cada a¡ <ST. 

Podemos ver que L(G) C L(G'). En efecto, si derivamos u — a¡ l ...ai n e L(G), entonces 
usando las reglas correspondientes, podemos derivar A ¡1 .. .A¡ n en G' . Como en G' tenemos las 
reglas A¡ —> a¡, entonces podemos derivar u e L(G'). 

Para demostrar la inclusión inversa: L(G / ) C L(G), definimos un homomorfismo h de (V' U 
T)* en (V U T)* de la siguiente forma, 








1. h(A¡) = a¡, i = 

2. h(x ) = x, Vx G V U T 
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Ahora se puede demostrar que este homorfismo transforma las reglas: si a —> p G P', enton¬ 
ces h{ a) —> /z(P) es una producción de P ó h{a) = fi(p). 

Partiendo de esto se puede demostrar que si a =>■ p entonces h(d) =>■ /z((3). En particular, 
como consecuencia, si S u, u G T*, entonces /z(S) = S =>■ h(u) = w. Es decir, si u G L(G') 
entonces u G L(G). Con lo que definitivamente L(G) = L{G'). ■ 


Ejercicios 

i. Demostrar que la gramática 


genera el lenguaje 


G=({S},{a,b},{S^£,S^ aSb},S ) 


L = {a l b‘ | ¿ = 0,1,2} 


Solución: 

5/ seguimos este procedimiento, nos encontramos que podemos ir generando todas las 
palabras de la forma a'b 1 , y siempre nos queda la palabra a'Sb' para seguir generando 
las palabras de mayor longitud. 

Por otra parte, estas son las únicas palabras que se pueden generar. 


2. Encontrar el lenguaje generado por la gramática G — {{A.B.S}, {a.b\.P.S) donde P 
contiene las siguientes producciones 

S —► aAB bB —> a Ab —» SBb 

Aa —> SaB B —> SA B —> ab 


Solución: 

El resultado es el Lenguaje vacío: nunca se puede llegar a generar una palabra con 
símbolos terminales. Siempre que se sustituye S aparece A, y siempre que se sustituye A 
aparece S. 
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3. Encontrar una gramática libre del contexto para generar cada uno de los siguientes len¬ 
guajes 

a) L — {ci'b-i | i, j G N, i < /} 

Solución: 


S —> aSb 
S^£ 
S^Sb 


b) L = {a'bhdb' \ i, j G N} 

Solución: 


S —> aSb 

S —> i?, B —> bBa, B —> £ 


c) L — {a'b'a^V \ i. j G A"} 

Solución: 

Podemos generar {a'b 1 \ i G A"} con: 

Si —> oSi¿>, Si —> £ 


El lenguaje L se puede generar añadiendo: 

S-^SiSi 


siendo S el símbolo inicial. 




Cap. 1 Introducción 


31 


d) L = {a‘b l | i G N} U {¿V | i G N} 

Solución: 

Podemos generar {a'b 1 \ i G N} con: 


5i —» aS\b , 5i —>• £ 


y {¿>'o' | i G IV} con 


52 —> ¿> 520 , 52 —i ► £ 


El lenguaje L se puede generar añadiendo: 


siendo S el símbolo inicicd. 


S 


Si, 


5 —> 5 2 


e) L — {uu 1 |«G{fl,l>}*} 

Solución: 


aSa, S —> bSb, 5 —> £ 


fj L = {flW^|í,jG/V} 

Solución: 


5 —> o5c, S —> B, 
B —> ¿rfíc, B —> £ 


donde 9\¿ es el conjunto de los números naturales incluyendo el 0. 

4. Determinar si la gramática G = ({5, A,5}, {o,¿>,c, J},P,5) donde P es el conjunto de 
reglas de producción 

5 —■> Aü A —► A¿> A —■» o 

B —> cfi B —>• d 
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genera un lenguaje de tipo 3. 

Solución: 


Esta gramática genera el lenguaje: {ab'cUl : i, j e N}, y este lenguaje se puede generar 
mediante la gramática: 

S —■> aB , B —» bB, B C, C —> cC, C d 
Como esta gramática es de tipo 3, el lenguaje lo es. 
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Los autómatas finitos son capaces de reconocer solamente, un determinado tipo de lengua¬ 
jes, llamados Lenguajes Regulares, que pueden ser caracterizados también, mediante un tipo de 
gramáticas llamadas también regulares. Una forma adicional de caracterizar los lenguajes regu¬ 
lares, es mediante las llamadas expresiones regulares, que son las frases del lenguaje, construidas 
mediante operadores sobre el alfabeto del mismo y otras expresiones regulares, incluyendo el 
lenguaje vacío. 

Estas caracterizaciones de los lenguajes regulares se utilizan en la práctica, según que la 
situación concreta esté favorecida por la forma de describir el lenguaje de cada una de ellas. Los 
autómatas finitos se utilizan generalmente para verificar que las cadenas pertenecen al lenguaje, 
y como un analizador en la traducción de algoritmos al ordenador. 

Las gramáticas y sus reglas de producción se usan frecuentemente en la descripción de la 
sintaxis de los lenguajes de programación que se suele incluir en los manuales correspondientes. 
Por otro lado, las expresiones regulares proporcionan una forma concisa y relativamente sencilla 
(aunque menos intuitiva) para describir los lenguajes regulares, poniendo de manifiesto algunos 
detalles de su estructura que no quedan tan claros en las otras caracterizaciones. Su uso es 
habitual en editores de texto, para búsqueda y sustitución de cadenas. 

En definitiva, las caracterizaciones señaladas de los lenguajes (formales) regulares, y por 
tanto ellos mismos, tienen un uso habitual en la computación práctica actual. Esto por sí mismo 
justificaría su inclusión en un curriculum de computación teórica. 


2.1. Autómatas Finitos Determinísticos 

Antes de dar una definición formal de lo que es un autómata vamos a dar una descripción 
intuitiva mediante un ejemplo. 

Ejemplo 14 Vamos a diseñar un autómata que reconozca el paso de un alumno por una asig¬ 
natura, por ejemplo, Modelos de Computación I. Representará las distintas decisiones que se 
realizan y si se aprueba o suspende la asignatura. Se controla que no haya más de dos convo¬ 
catorias por año y se termina cuando se aprueba la asignatura. 

Habrá un alfabeto de entrada contendrá los siguientes elementos: 

■ P: El alumno se presenta a un examen. 

■ N: El alumno no se presenta a un examen. 

■ A: El alumno aprueba un examen. 


S: El alumno suspende un examen. 



Cap. 2 Autómatas Finitos, Expresiones Regulares y Gramáticas de tipo 3 


35 



Figura 2.1: Paso de un alumno por una asignatura 


La secuencia se ilustra en la figura 2.1. Comenzamos en un estado, Inicio. A continuación 
decidimos si presentarnos en Febrero o no. Si nos presentamos y aprobamos, terminamos. Si no 
nos presentamos o suspendemos, tenemos que decidir si nos presentamos en septiembre, pero 
como hay que controlar que un estudiante no se presente a tres convocatorias en un año, los 
estados son distintos en ambos casos. Si en septiembre aprobamos, terminamos. Si suspende¬ 
mos y ya nos habíamos presentado en febrero, comenzamos de nuevo. En otro caso, podemos 
decidir si presentarnos en diciembre. Si aprobamos, terminamos y si suspendemos, empezamos 
de nuevo. 

Este esquema corresponde a un autómada finito. Se caracteriza por una estructura de con¬ 
trol que depende de un conjunto finito de estados. Se pasa de unos a otros leyendo símbolos del 
alfabeto de entrada. Este autómata representa una versión simplificada del problema real, ya 
que no controla el número total de convocatorias. Un autómata para todas las asignaturas se 
podría construir uniendo autómatas para cada una de las asignaturas, pero teniendo en cuenta 
relaciones como requisitos entre las mismas. 

Definición 23 Un autómata finito es una quintupla M = (Q, A, 8, qo,F) en que 
- Q es un conjunto finito llamado conjunto de estados 
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Figura 2.2: Autómata de Estado Finito 


- A es un alfabeto llamado alfabeto de entrada 

- 8 es una aplicación llamada función de transición 


5 :QxA-^Q 

- c/o es un elemento de Q, llamado estado inicial 

- F es un subconjunto de Q, llamado conjunto de estado finales. 

Desde el punto de vista intuitivo, podemos ver un autómata finito como una caja negra de 
control (ver Figura 2.2), que va leyendo símbolos de una cadena escrita en una cinta, que se 
puede considerar ilimitada por la derecha. Existe una cabeza de lectura que en cada momento 
esá situada en una casilla de la cinta. Inicialmente, esta se sitúa en la casilla de más a la izquierda. 
El autómata en cada momento está en uno de los estado de Q. Inicialmente se encuentra en q o. 

En cada paso, el autómata lee un símbolo y según el estado en que se encuentre, cambia de 
estado y pasa a leer el siguiente símbolo. Así sucesivamente hasta que termine de leer todos los 
símbolos de la cadena. Si en ese momento la máquina está en un estado final, se dice que el 
autómata acepta la cadena. Si no está en un estado final, la rechaza. 

Definición 24 El diagrama de transición de un Autómata de Estado Finito es un grafio en el que 
los vértices representan los distintos estados y los arcos las transiciones entre los estados. Cada 
arco va etiquetado con el símbolo que corresponde a dicha transición. El estado inicial y los 
finales vienen señalados de forma especial (por ejemplo, con un ángulo el estado inicicd y con 
un doble círculo los finales). 

Ejemplo 15 Supongamos el autómata M = (Q.A.qo. ó. F) donde 

- Q = {<70, <71, <72} 

- A = {a,b} 
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Figura 2.3: Diagrama de Transición Asociado a un Autómata de Estado Finito 


- La función de transición 8 está definida por las siguientes igualdades: 


§{qo,a)=q\ b(qo,b) = q 2 

&(qi,a) = q\ &(qi,b) = q 2 

b(q 2 ,a)=qi ${q 2 ,b) = qo 

- F = {q t} 

El diagrama de transición viene expresado en la Figura 2.3. 


2.1.1. Proceso de cá lculo asociado a un Autómata de Estado Finito 

Para describir formalmente el comportamiento de un autómata de estado finito, vamos a 
introducir el concepto de configuración y paso de cálculo. 

Definición 25 Si M — (Q.A.8. qo, F) es un autómata de estado finito una configuración es un 
elemento del producto cartesiano Q x A*. 

Una configuración es un par (q, u) donde q es un estado y u una palabra. Intuitivamente una 
configuración contiene los elementos que determinan la evolución futura del autómata. En este 
sentido, q será el estado en el que se encuentra el autómata y u lo que queda por leer en un 
momento dado. 

Inicialmente, autómata está en el estado inicial qo y nos queda por leer toda la palabra de 
entrada. El siguiente concepto recoge esta idea. 

Definición 26 Si M — (2, A, 8 , ¿ 70 , F) es una autómata finito determinista y u G A* es una pala¬ 
bra, entonces se llama configuración inicial asociada a esa palabra a la configuración {qo. u). 
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Intuitivamente, la configuración inicial indica que estamos en el estado inicial y nos queda 
por leer toda la palabra u. 

A continuación definimos la relación paso de cálculo entre dos configuraciones. 

Definición 27 Si M — (Q.A.8. qo, F) es una autómata finito determinista y ( p,u ), (q,v) son dos 
configuraciones, decimos que se puede pasar de ( p,u ) a (q,v) en un paso de cálculo, lo que se 
nota como (p, u) b (q , v) si y sólo si u — av, donde a G A y 8(p, a) = q. 

Finalmente, definimos la relación de cálculo entre dos configuraciones. 

Definición 28 Si M = ( Q,A,8,qo,F ) es una autómata finito determinista y ( p,u),(q,v ) son 

dos configuraciones, decimos que puede pasar de (p, u) a (q. v) en una secuencia de cálcu- 

* 

lo, lo que se nota como ( p,u ) b (q,v) si y solo si existe una sucesión de configuraciones: 
(po,u 0 ),.. .(p n ,u n ) donde n> 1 , de tal forma que ( po,u 0 ) = (p,u), ( p n ,u n ) = (q,v)y (pí,uí) b 
(p í+ i,M/+i),Vi < n. 


Existe otro enfoque alternativo para definir formalmente el cálculo asociado a un autómata 
de estado finito y consiste en definir la función de transición de un autómata aplicada a una 
palabra. Esta función que llamaremos 8 ' se define de forma recursiva 

Definición 29 Si M = (Q.A.S.qo, F) es un autómata de estado finito se define la función de 
transición asociada a palabras, como la función 

8 ':QxA*-^Q 


dada por 


8 ; (<?,£) = q 

8 \q,aw) — 8'(d(q,a),w), wGA*, 

Ejemplo 16 En el caso del autómata del ejemplo 15, tenemos que 

S'(qo,aba) = S 1 (b(qo,a),ba) = d'(qi,ba) = 8 1 ($(qi,b),a) = 

8 \q 2 ,b) = S '(8 (q 2 ,b),e) = 8 f (qi,e) = <71 

Desde el punto de vista intuitivo, 8 representa el comportamiento del autómata en un paso 
de cálculo, ante la lectura de un carácter. Esto viene dado por el estado al que evoluciona el 
autómata. La cabeza de lectura siempre se mueve a la derecha. 8' representa una sucesión de 

cálculos del autómata: a qué estado evoluciona después de haber leído una cadena de caracteres. 

* * 

La relación entre 8 ' y b es la siguiente: 8'(p, u) = q si y sólo si (p, u) b (< 7 , e). 
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Figura 2.4: Autómata que acepta el lenguaje de palabras con un número impar de unos 

2.1.2. Lenguaje aceptado por un Autómata de Estado Finito 

Definición 30 Una palabra u G A* se dice aceptada por un autómata M = (Q.A.jó. qo, F) si 

* 

y solo si existe un q e F tal que (qo,u) h (//.£). En caso contrario, se dice que la palabra es 
rechazada por el autómata. 

Es decir, una palabra es aceptada por un autómata si comenzando a calcular en el estado qo 
y leyendo los distintos símbolos de la palabra llega a un estado final. 

En el caso del autómata del ejemplo 15, la palabra aba es aceptada por el autómata. La 
palabra aab es rechazada. 

Definición 31 Dado un autómata M — (Q.A.8. qo, F) se llama lenguaje aceptado o reconocido 
por dicho autómata al conjunto de las palabras de A* que acepta: 

* 

L(M ) — {u eA* : ( qo,u ) h (q,é),q G F} 

Ejemplo 17 El autómata dado por el diagrama de transición de la Figura 2.4 acepta el lenguaje 
formado por aquellas cadenas con un número impar de unos. 


Ejemplo 18 Los autómatas suelen servir para reconocer constantes o identificadores de un 
lenguaje de programación. Supongamos, por ejemplo, que los reales vienen definidos por la 
gramática G = (V, T, P, S ) en la que 

- 7 = {+,—,£,0,1, —,9,.} 

- V — {< Signo >, < Dígito >, < Natural >, < Entero >, < Real >} 

- S =< Real > 

- P contiene las siguientes producciones 

< Signo >—> +| — 

< Dígito >—> 0|1|2|3|4|5|6|7|8|9 
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Figura 2.5: Autómata Finito Determinista que acepta constantes reales 


<Natural>^<Digito> \ <Digito><Natural> 

<Entero > —> <Natural> 

<Entero>^<Signo><Natural> 

<Real>^<Entero> 

<Real>^<Entero>. 

<Real>^<Entero> . <Natural> 

<Real>^<Entero> . <Natural> E <Entero> 

Este lenguaje puede ser descrito también por un autómata de estado finito, como el de la 
Figura 18, en el que el alfabeto es A — {0,1,2,_,9, +, — ,E}. 

Si un lenguaje es aceptado por un autómata de estado finito, tenemos un procedimiento al¬ 
gorítmico sencillo que nos permite decir qué palabras pertenecen al lenguaje y qué palabras no 
pertenecen. Es mucho más cómodo que la gramática inicial, aunque la gramática es más expre¬ 
siva. No todos los lenguajes pueden describirse mediante autómatas de estado finito. Los más 
importantes son los identificadores y constantes de los lenguajes. Sin embargo, es importan¬ 
te señalar que a partir de una gramática de tipo 3 podemos construir de forma algorítmica un 
autómata que acepta el mismo lenguaje que el generado por la gramática. 










Figura 2.6: Recepción de Ficheros en el protocolo Kermit 


Ejemplo 19 Comunicaciones. Protocolo Kermit.- Los autómatas finitos proporcionan modelos 
de programación para numerosas aplicaciones. El protocolo Kermit se puede implementar como 
un control de estado finito. Vamos afijarnos en una pequeña parte del mismo: la transferencia 
de ficheros entre micros y mainframes y, más concretamente en la recepción de estos ficheros. 

El esquema del programa de recepción de datos corresponde al de una máquina de estado 
finito (ver Figura 2.6). Inicialmente, la máquina está en un estado de espera, R. En este estado 
está preparado para recibir una cabecera de transmisión (símbolo de entrada S), en cuyo caso 
pasa al estado RF, en el que espera la recepción de una cabecera de fichero (símbolo de entrada 
H). En ese momento pasa cd estado RD, en el que procesa una serie de datos correspodientes 
al fichero (símbolos D). Si, en un momento dado, recibe un fin de fichero (símbolo Z) pasa al 
estado RF, donde puede recibir otra cabecera de fichero. Si estando en el estado RF se recibe 
un código de fin de la transmisión el autómata pasa al estado inicial R. El estado final es R: Una 
transmisión es aceptada si, al final de cada fichero se produce un fin de fichero y cd final de todos 
los ficheros un fin de transmisión que le permite volver a R. Si, en un momento dado se produce 
una entrada inesperada (por ejemplo, un fin de la transmisión cuando se están recibiendo datos 
de un fichero en particular) se pasa a un estado de error, E. Este estado es absorvente: cualquier 
otra entrada le hace quedar en el mismo estado. 

El esquema del emisor es mas complicado. También ésto es solo un esquema del comporta¬ 
miento del receptor. En realidad, éste no solo determina si la transmisión se ha realizado con 
éxito, sino que ejecuta acciones cada vez que recibe datos. Esto no lo puede hacer un autómata 
de estado finito, pero sí otro tipo de máquinas un poco más sofisticadas que estudiaremos más 
adelante. De todas formas, lo importante es advertir como el modelo de computación de los 
autómatas finitos sirve para expresar de forma elegante el mecanismo de control de muchos 
programas. 
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2.2. Autómatas Finitos No-Determinísticos (AFND) 

En este apartado vamos a introducir el concepto de autómatas finitos no determinísticos 
(AFND) y veremos que aceptan exactamente los mismos lenguajes que los autómatas deter¬ 
minísticos. Sin embargo, serán importantes para demostrar teoremas y por su más alto poder 
expresivo. 

En la definición de autómata no-determinístico lo único que cambia, respecto a la definición 
de autómata determinístico es la función de transición. Antes estaba definida 

5 :QxA^Q 

y ahora será una aplicación de Q x A en p{Q) (subconjuntos de Q ): 

8:QxA^p(Q) 

La definición completa quedaría cornos sigue. 

Definición 32 Un autómata finito no-determinístico es una quintupla M — (Q,A,8,qo,F) en 
que 


- Q es un conjunto finito llamado conjunto de estados 

- A es un alfabeto llamado alfabeto de entrada 

- 8 es una aplicación llamada función de transición 

8 :QxA^(p{Q) 

- ¿yo es un elemento de Q, llamado estado inicial 

- F es un subconjunto de Q, llamado conjunto de estado finales. 

La interpretación intuitiva es que ahora el autómata, ante una entrada y un estado dado, puede 
evolucionar a varios estados posibles (incluyendo un solo estado o ninguno si 8{q,a) — 0). Es 
decir es como un algoritmo que en un momento dado nos deja varias opciones posibles o incluso 
puede no dejarnos ninguna. 

Una palabra se dice aceptada por un AFND si, siguiendo en cada momento alguna de las 
opciones posibles, llegamos a un estado final. 

A continuación, vamos a extender 8 definida en <2 x A a una función 8 * definida en fp{Q) x A, 
es decir, para que se pueda aplicar a conjuntos de estados, no sólo a un estado dado. 8 * se define 
de la siguiente forma, 
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Si P C Q y u E A, 8 * (P, a) — [J b(q, a) 

qeP 

Esta función se puede extender para aplicarse también a palabras de la siguiente forma: 

Si B C Q, 

• b*{B,e) = B 

■ b*(B,au) — 8*(8*(B,a),u) 

8 * se puede aplicar también a un sólo estado de acuerdo con la siguiente expresión: 8 * ( q , u) = 

s*(M,«) 

Con estos elementos podemos definir cuando una palabra es aceptada por un autómata no- 
determinístico. 

Definición 33 Sea M = (Q.A.S.qo. F) un autómata finito no-determinístico y u e A*. Se dice 
que la palabra u es aceptada por M si y solo si 8 / (<g r o,«) fli 7 0 . 

Definición 34 Sea M = ( Q,A,6,qo,F ) «n AFND, se llama lenguaje aceptado por el autómata 
al conjunto de palabras de A* que acepta, es decir 

L(M) - {mgA* ¡ 8 / ((/o,M)nF^0} 

Cuando no haya lugar a confusión, 8* será representadas como 8, simplemente. 

En clase, el lenguaje aceptado por un autómata no determinista se ha definido de forma dis¬ 
tinta, pero ambas definiciones son totalmente equivalentes. Se define en función de la definición 
de la relación de proceso de cálculo entre dos configuraciones que, análogamente como se hizo 
con los autómatas deterministas, se basa en definir los siguientes elementos: 

■ Descripción Instantánea o Configuración: 

Un elemento de Q x A*: (q, u). 

■ Configuración Inicial para u E A*: {qo. u) 

■ Relación paso de cálculo entre dos configuraciones: 

{{q,au) b (p,v))^pe S(q,a)) 

Aquí, al contrario de lo que ocurría en los autómatas deterministas, desdee una configu¬ 
ración se puede pasar a varias configuraciones distintas en un paso de cálculo, e incluso a 
ninguna. 
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Figura 2.7: Autómata Finito No-Determinístico 



Figura 2.8: Autómata Finito Determinista 

■ Relación de cálculo entre dos configuraciones: 

* 

((q,u) F (p,v)) si y solo si existe una sucesión de configuraciones Co,...,C„ tales que 
C 0 = (q,u),C n = (p,v) y Vi<h-1,C¿FC/ + i. 

Finalmente, el lenguaje aceptado por un AF no-determinista es 

* 

L(M ) — {u E A* : 3q E F, (qo, u) b (q, e)} 

2.2.1. Diagramas de Transición 

Los diagramas de transición de los AFND son totalmente análogos a los de los autómatas 
determinísticos. Solo que ahora no tiene que salir de cada vértice un y solo un arco para cada 
símbolo del alfabeto de entrada. En un autómata no determinístico, de un vértice pueden salir 
ninguna, una o varias flechas con la misma etiqueta. 

Ejemplo 20 Un AFND que acepta el lenguaje 

L — {uE {a, b, c}* | u = ab'c, i > 0} 

es el de la Figura 2. 7. 

Este es un autómata no-determinista ya que hay transiciones no definidas. 
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Figura 2.9: Autómata No-Determinista que reconoce la cadena 010010. 

En general, los autómatas no-determinísticos son más simples que los determinísticos. Por 
ejemplo, un autómata determinístico que acepta el mismo lenguaje que el anterior es el que 
viene dado por la Figura 2.8 

Ejemplo 21 (Reconocimiento de Patrones).- Supongamos un ejemplo de tranmisión de datos 
entre barcos. El receptor de un barco debe de estar siempre esperando la trasmisión de datos 
que puede llegar en cualquier momento. Cuando no hay trasmisión de datos hay un ruido de 
fondo (sucesión aleatoria de 0,1). Para comenzar la trasmisión se manda una cadena de aviso, 
p.e. 010010. Si esa cadena se reconoce hay que registrar los datos que siguen. 

El programa que reconoce esta cadena puede estar basado en un autómata finito. La idea 
es que este no pueda llegar a un estado no final mientras no se reciba la cadena inicial. En ese 
momento el autómata pasa a un estado final. A partir de ahí todo lo que llegue se registra. Nues¬ 
tro propósito es hacer un autómata que llegue a un estado final tan pronto como se reconozca 
010010. Intentar hacer un autómata finito determinístico directamente puede ser complicado, 
pero es muy fácil el hacer un AFND, como el de la Figura 2.9. 

Hay que señalar que esto sería solamente el esquema de una sola parte de la trasmisión. Se 
podría complicar incluyendo también una cadena para el fin de la trasmisión. 

Ejemplo 22 Autómata no-determinístico que acepta constantes reales Ver Figura 2.10 

2.2.2. Equivalencia de Autómatas Determinísticos y No-Determinísticos 

La siguiente definición muestra como construir a partir de un autómata finito no-determinístico 
otro determinístico que acepte el mismo lenguaje. 

Definición 35 Dado un AFND M — (Q.A. 'd.qo. F) se llama autómata determinístico asociado 
a M, al autómata M = (Q, A, b,qo,F) dado por 

- Q = <P{Q) 

- <70 = {<7o} 

- 8(A,a) — 8*(A, a) 
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Figura 2.10: Autómata No-Determinístico que reconoce constantes reales. 

_ F = {AgíP(£) | AHF ^ 0} 

Dado un autómata no determinístico se le hace corresponder uno determinístico que recorre 
todos los caminos al mismo tiempo. 

Ejemplo 23 En la Figura 2.11 podemos ver un autómata finito no-determinista del ejemplo 21 
(figura 2.9) y su autómata determinístico asociado. 

Teorema 2 Un AFND M y su correspondiente Autómata determinístico M aceptan el mismo 
lenguaje. 


Demostración 

La demostración se basa en probar que 

6*(<7o,w) = §*(<7o,w) 


Es decir, que el conjunto de estados en los que puede estar el autómata no determinista 
coincide con el estado en el que está el autómata determinista que hemos construido. Ambos 
aceptan una palabra si al final de su lectura uno de estos estados es final. 
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Figura 2.11: Autómata Finito No-Determinístico y Autómata Finito Determinístico asociado 
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El teorema inverso es evidente: dado un autómata determinístico M = (Q,A, 8, qo , F) pode¬ 
mos construir uno no-determinista M — ( Q,A , 8,qo,F) que acepta el mismo lenguaje. Solo hay 
que considerar que 6(qo,a) — {8(go,«)}: En cada situación solo hay un camino posible, el dado 
por 8. 


2.3. Autómatas Finitos No Deterministicos con transiciones 
nulas 

Son autómatas que pueden relizar una transición sin consumir entrada. Estas transiciones se 
etiquetan con £ en el diagrama asociado. 

En la definición, lo único que hay que cambiar es la función de transición que ahora está de¬ 
finida de Q x (A U {e}) en (P(Q). 

Las transiciones nulas dan una nueva capacidad al autómata. Si se tiene una transición nula, 
el autómata puede quedarse donde está o cambiar de estado sin consumir ningún símbolo de la 
palabra de entrada. Como en los AFND, una palabra será aceptada si se llega a un estado final 
con alguna de las elecciones posibles. 

Ejemplo 24 El autómata siguiente acepta las palabras que son una sucesión de ceros, seguida 
de una sucesión de 1, seguida de una sucesión de 2. 

Q° Q 

*fao) — 



Ejemplo 25 El autómata dado por el siguiente diagrama, 



acepta 

el lenguaje {b 2 i : i > 0} U {ab 2 i: i > 0} U {b 2 ic : i > 0} U {ab 2 ic : i > 0} 

Definición 36 Se llama clausura de un estado al conjunto de estados a los que puede evolucio¬ 
nar sin consumir ninguna entrada, 


CL(p') = {q e Q : 3qi,... ,q k tal que p = q h q = q k ,q¡ G 8(^-_i,e),í > 2} 
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Definición 37 Si P C Q se llama clausura de P a 

cup) = U CL <p) 

peP 

Ejemplo 26 En el ejemplo anterior tenemos que 

CL(qi) = {qi,q 2 } 

CL(qo,qi) = {<7o,<?i,< 72 } 

La función de transición 8 se extiende a conjuntos de estados de la siguiente forma: 

S(R,w) = |^J 8(<7 ,m) 

#g/? 

A continuación vamos a determinar la función 8 ' que asocia a un estado y a una palabra de 
entrada el conjunto de los estados posibles. 

8 / (<?,e) = CL(< 7 ) 

8 '(q,au)— [J 8 >'(r,u) 

red(CL(q),a) 

Es conveniente extender la función 8' a conjuntos de estados, 

8 '{R,u) — [J 8 \q,u) 

Notemos que 8 '(q,a) no es lo mismo que 8{q,a) por lo que distinguiremos entre las dos 
funciones. 

Una palabra, u G A* , se dice aceptada por un AFND con transiciones nulas M = (Q,A, 8 , qo, F ) 
si y solo si 


8 '(q,u) ílF ^ 0 

El lenguaje aceptado por el autómata, L(M), es el conjunto de palabras de A* que acepta. 
Las transiciones nulas son muy útiles para modificar autómatas o para construir autómatas mas 
complejos partiendo de varios autómatas. 
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Ejemplo 27 Los siguientes dos autómatas aceptan las palabras que contienen en su interior la 
subcadena 0110 y 1000 respectivamente 



Para construir un autómata que acepte las palabras aceptadas por uno cualquiera de estos 
dos autómatas, es decir, las palabras con una subcadena 0110 ó una subcadena 1000 se pone 
un nuevo estado inicial que se une con los antiguos mediante transiciones nulas. 



Ejemplo 28 Consideremos el siguiente autómata que acepta las palabras del alfabeto {a,b,c} 
que tienen una sola b y ésta va seguida de una c. 



Si L es el lenguaje que acepta el autómata anterior modifiquémoslo para que acepte cual¬ 
quier sucesión no nula de palabras de L: cualquier palabra de L + . Para ello se unen los estados 
finales del autómata con el estado inicial mediante una transición nula: 
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Las transiciones nulas, como vemos dan más capacidad de expresividad a los autómatas, pero 
el conjunto de lenguajes aceptados es el mismo que para los autómatas finitos determinísticos, 
como queda expresado en el siguiente teorema. 


Teorema 3 Para todo autómata AFND con transiciones nulas existe un autómata finito deter- 
minístico que acepta el mismo lenguaje. 


Demostración.- Si M — ( Q,A,b,qo,F ) es un AFND con transiciones nulas, basta construir un 
AFND sin transiciones nulas M = (Q,A,8,q 0 ,F). A partir de éste se puede construir uno deter- 
minístico. 

El autómata M se define de la siguiente forma 


F = 


F ifCL(q 0 )nF = (ñ 

F U { 40 } en caso contrario 


( 2 . 1 ) 


8(g,a) = b\q,a) (2.2) 

El resto de los elementos se definen igual que en M. 

Para demostrar que ambos autómatas aceptan el mismo lenguaje basta con probar que 


8 (q, u) — 8 '(q, u) si u £ 
y que £ se acepta de igual forma en las dos máquinas. 


(2.3) 


Ejemplo 29 El AFND correspondiente al autómata con transiciones nulas del ejemplo 19, 
acepta el mismo lenguaje que el siguiente autómata determinista: 
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2.4. Expresiones Regulares 

Una expresión regular es una forma de representar cierto tipo de lenguajes sobre un determi¬ 
nado alfabeto. Veremos que son exactamente los aceptados por los autómatas de estado finito. 

Definición 38 Si A es un alfabeto, una expresión regular sobre este alfabeto se define de la 
siguiente forma: 

- 0 es una expresión regular que denota el lenguaje vacío. 

- £ es una expresión regular que denota el lenguaje {e} 

- Si a £ A, a es una expresión regular que denota el lenguaje {a} 

- Si r y s son expresiones regulares denotando los lenguajes R y S entonces definimos las 
siguientes operaciones: 

- Unión: (r + s) es una expresión regular que denota el lenguaje RUS 

- Concatenación: (rs) es una expresión regular que denota el lenguaje RS 

- Clausura: r* es una expresión regular que denota el lenguaje R*. 

De acuerdo con la definición anterior, se puede determinar no solo cuales son las expresiones 
regulares sobre un determinado alfabeto, sino también cuales son los lenguajes que denotan o 
lenguajes asociados. Los lenguajes que pueden representarse mediante una expresión regular se 
llaman lenguajes regulares. Estos coinciden con los aceptados por los autómatas finitos, como 
veremos mas adelante. 

Los paréntesis se pueden eliminar siempre que no haya dudas. La precedencia de las opera¬ 
ciones es 


- Clausura 
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- Concatenación 

- Unión 

Ejemplo 30 Si A — {a,b,c} 

- (a + £)b* es una expresión regular que denotal el lenguaje {a'b 7 : i = 0,1; j > 0} 

SiA = { 0,1} 

- 00 es una expresión regular con lenguaje asociado {00}. 

- 01 * + 0 es una expresión regular que denota el lenguaje {01' : i > 0}. 

- (1 +10)* representa el lenguaje de las cadenas que comienzan por 1 y no tienen dos ceros 
consecutivos. 

- (0 + 1)*011 representa el lenguaje de las cadenas que terminan en 011. 

- 0*1* representa el lenguaje de las cadenas que no tienen un 1 antes de un 0 

- 00 * 11 * representa un subconjunto del lenguaje anterior formado por cadenas que al me¬ 
nos tienen un 1 y un 0. Si la expresión regular rr* se representa como r + , 00*11* se puede 
reprensentar como 0 1 + . 

2.4.1. Propiedades de las Expresiones Regulares 

Dos expresiones regulares se consideran iguales si representan el mismo lenguaje. Teniendo 
esto en cuenta, se puede comprobar que siempre se verifican las siguientes igualdades. 

1. ri + r 2 = r 2 + ri 

2. ri + (r 2 + r 3 ) = (rx + r 2 )+r 3 

3. ri(r 2 r 3 ) = (rir 2 )r 3 

4. r£ = r 

5. r0 = 0 

6. r + 0 = r 

7. £*=£ 


8 . 


ri(r 2 + r 3 ) =rir 2 + rir 3 
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9. (ri+r 2 )r 3 = rir 3 + r 2 r 3 

10. r + +£ = r* 

11. r* + £ = r* 

12. (r + £)*=r* 

13. (r + £)+ = r* 

14. (r; + r*)* = (r 1 + r 2 )* 

15. (rjrí)* = (r,+r 2 )* 

2.4.2. Expresiones Regulares y Autómatas Finitos 

A continuación vamos a relacionar los lenguajes representados por las expresiones regulares 
con los aceptados por los autómatas finitos. Demostraremos dos teoremas. El primero nos dice 
que todo lenguaje asociado por una expresión regular puede ser aceptado por un autómata de 
estado finito. El segundo la relación recíproca. Dado un autómata de estado finito, veremos como 
se puede construir una expresión regular que denote el lenguaje aceptado por dicho autómata. 

Teorema 4 Dada una expresión regular existe un autómata finito que acepta el lenguaje aso¬ 
ciado a esta expresión regular. 

Demostración.- Vamos a demostrar que existe un AFND con transiciones nulas. A partir de él 
se podría construir el autómata determinístico asociado. 

La construcción del autómata va a ser recursiva. No vamos a expresar como son los estados y 
las transiciones matemáticamente, sino que los autómatas vendrán expresados de forma gráfica. 
Para las expresiones regulares iniciales tenemos los siguiente autómatas: 

- 0 


- £ 




a 
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Ahora veremos como se pueden construir autómatas para las expresiones regulares com¬ 
puestas a partir de los autómatas que aceptan cada una de sus componentes. 

Si M\ es el autómata que acepta el mismo lenguaje que el representado por ri y Mi el que 
acepta el mismo lenguaje que el de r 2 , entonces 


- El autómata que acepta que mismo lenguaje que el asociado a (rj + r 2 ) es 



- El autómata para la expresión (r^) es 



M\ M2 

- El autómata para es 
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Se puede comprobar que efectivamente estos autómatas verifican las condiciones pedidas y 
que el procedimiento de construcción siempre acaba. 


Ejemplo 31 Construyamos un autómata que acepta el mismo lenguaje que el asociado a la 
expresión regular r = (0 +10) *011 

- Autómata correspondiente a 1 



- Autómatas correspondientes a 1 y 0 



- El autómata asociado a 10 es 



- Autómatas asociado a 10 y 0 
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- Autómata asociado a 10 + 0 



- Autómata asociado a (10 + 0)* 



Autómatas asociado a (10 + 0)* y 011 
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- Autómatas asociado a (10 + 0)* y 011 



Teorema 5 Si L es aceptado por un autómata finito determinístico, entonces puede venir expre¬ 
sado mediante una expresión regular. 


Demostración. - 

Sea el autómata M = donde Q — { q \,... ,q n } y q\ es el estado inicial. 

Sea el conjunto de las cadenas de A* que premi ten pasar del estado q¡ al estado qj y 
no pasa por ningún estado intermedio de numeración mayor que k (q¡ y qj si pueden tener 
numeración mayor que k). 

R¡j se puede definir de forma recursiva: 

r0 = ( {a\5(qi,a) = qj} si i^j 

lj \ {a : 8(q¡,a) =< 7 /}U{£} si i = j 

Para k > 1, tenemos la siguiente ecuación: 


nk _ j?k— 1 /p 

K ij ~i(k-l)( K 
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Vamos a demostrar que para todos los lenguajes R k ¡j existe una expresión regular rjj que lo 
representa. Lo vamos a demostrar por inducción sobre k. 

Para k — 0 es inmediato. La expresión regular rjj puede escribirse como 

ai +... + ai si i^j 
ai +... + ai + £ si i — j 

donde {ai,...,«/} es el conjunto {a : 8(g¡,a) = qj}. Si este conjunto es vacío la expresión regu¬ 
lar sería: 


0 si «Y j 

£ SÍ i = j 

Es claro que estas expresiones regulares representan los conjuntos R ( -j. 
Supongamos ahora que es cierto para k— 1. Entonces sabemos que 


pk _ J?k— 1 / J?k— 1 

*ij ~i(k- 1) v (*-i)(*-i; 




Por la hipótesis de inducción, existen expresiones regulares para los lenguajes R¡ m 1 , que se 
denotan como 1 De aquí se deduce que una expresión regular para R k J l viene dada por 


r k-l /„k—1 


/'-.K—i \* k— i „k 1 

i)(r~ ) Di, im+Ej 


L i(k-i)^(k-l)(k-l) 


(k~l)j 


con lo que concluye la demostración de que existen expresiones regulares para los lengua¬ 
jes R¡j . Además esta demostración nos proporciona un método recursivo para calcular estas 
expresiones regulares. 

Finalmente, para demostrar que el lenguaje aceptado por el autómata puede venir expresado 
mediante una expresión regular, solo hay que observar que 

¿(Ai) = U R "¡ 

qj eF 


Por tanto, L(M) viene denotado por la expresión regular rj x +... + rj k donde F = {q J¡ ,...,qj k 


Ejemplo 32 Sea el Autómata Finito Determinístico de la Figura 32. Vamos a construir la ex¬ 
presión regular que representa el lenguaje aceptado por este autómata. 
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1 



0 0,1 

Figura 2.12: Autómata Finito Determinístico 
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21 


YkYY 


23 


£ + £(£)*£ = £ 

0 + e(e)*0 = 0 
i+e(e)*i = 1 
0 + 0(e)*e = 0 
£ + 0(e)*0 = £ + 00 

i+o(e)*i = 1+01 

0 + 0(e)*£ = 0 
0+1 + 0(e)*O = 0+1 
£ + 0(e)*1 = £ 

£ + 0 (£ + 00 )* 0 = ( 00 )* 

0 + 0(e + 00)*(e + 00) = 0(00)* 
l+0(£ + 00)*(l+01) = 0*1 
0 + (e + 00) (e + 00) *0 = (00) *0 
£ + 00 + (£ + 00 )(£ + 00 )*(£ + 00 ) = ( 00 )* 
1+01 + (e + 00)(e + 00)*(1+01) =0*1 
0+(O+1)(e + OO)*O= (0+l)(00)*0 
0+l + (0+l)(£ + 00)*(£ + 00) = (0+l)(00)* 
£+(0+1 )(e + 00)*(1+01) =E+(0 +1)0*1 


Finalmente la expresión regular para el lenguaje aceptado es: 


r 12 + r 13 — r 12 + r 13( r 33)* r 32 + r 13 + r 13( r 33)* r 33 — 






Cap. 2 Autómatas Finitos, Expresiones Regulares y Gramáticas de tipo 3 


61 


0(00)*+ 0*l(e + (0+l)0*l)*(0+l)(00)*+ 0*1+ 0*l(£ + (0+l)0*l)*(£+(0+1)0*1) = 

0 ( 00 )* + 0 * 1 (( 0 + 1 ) 0 * 1 )*( 0 + 1 )( 00 )* + 0*1 + 0 * 1 (( 0 + 1 ) 0 * 1 )* 

Por último señalaremos que, por abuso del lenguaje, se suele identificar una expresión regular 
con el lenguaje asociado. Es decir, diremos el lenguaje (00 + 11)*, cuando, en realidad, nos 
estaremos refiriendo al lenguaje asociado a esta expresión regular. 


2.5. Gramáticas Regulares 

Estas son las gramáticas de tipo 3. Pueden ser de dos formas 

- Lineales por la derecha. - Cuando todas las producciones tienen la forma 

A —> uB 
A ^ u 

- Lineales por la izquierda. - Cuando todas las producciones tienen la forma 

A —■» Bu 
A —»u 

Ejemplo 33 La gramática dada por V = {5, A}, 7 = {0.1} y las producciones 

S^OA 
A -> 10A 
A —> £ 

es linecd por la derecha. Genera el lenguaje 0(01)* . 

El mismo lenguaje es generado por la siguiente gramática lineal por la izquierda 


S-^SIO 
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Teorema 6 Si L es un lenguaje generado por una gramática regular, entonces existe un autó¬ 
mata finito determinístico que lo reconoce. 

Demostración.- Supongamos que L es un lenguaje generado por la gramática G = ( V,T,P,S ) 
que es lineal por la derecha. Vamos a construir un AFND con movimientos nulos que acepta L. 

Este autómata será M — ( Q,T,b,q,F ) donde 

- Q = {[oc] : (a = S) V (3A G V, w G T, tales que A —> ua G P)} 

- qo= M 

- F = {[£]} 

- 8 viene definida por 

• Si A es una variable 

S([A],e) = {[a]: (A->a) eP} 

• Si a G T y a G (T*V), entonces 

8( [aa\, a) = [a] 

La aceptación de una palabra en este autómata simula la aplicación de reglas de derivación 
en la gramática original. La demostración formal de que esto es así no la vamos a considerar. 

En el caso de una gramática lineal por la izquierda, G = (V, T, P. S ), consideraremos la gra¬ 
mática G' = ( V. T. P'. 5) donde P' = {A —> a : A — > a G P}. Es decir que invertimos la parte 
derecha de las producciones. La gramática resultante G' es lineal por la derecha y el lenguaje 
que genera es L(G') = L(G) _1 . 

Ahora, podemos construir un autómata que acepte el lenguaje L(G'), siguiendo el proce¬ 
dimiento anterior. El autómata no determinístico correspondiente se puede transformar en uno 
equivalente con un solo estado final. Para ello basta con añadir un nuevo estado final, pasar a 
no-finales los estados finales originales y unir estos mediante una transición nula con el nuevo 
estado final. 

El siguiente paso es invertir el autómata ya con un solo estado final, para que pase de aceptar 
el lenguaje L(G') = L(G) _1 al lenguaje L(G')^ 1 = L(G) . Para ello los pasos son: 

- Invertir las transiciones 

- Intercambiar el estado inicial y el final. 

A partir de este autómata se podría construir un autómata determinístico, con lo que termina la 
demostración. 
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Ejemplo 34 De la gramática S —> 0 A,A —> 10A,A —» £ se obtiene el autómata, 



Ejemplo 35 La gramática lineal por la izquierda que genera el lenguaje 0(01)* tiene las si¬ 
guientes producciones 
S —> 510 
S^O 

Para construir un AFND con transiciones nulas qque acepte este lenguaje se dan los si¬ 
guientes pasos: 

1. Invertir la parte derecha de las producciones 
S —> 015 

S —>0 

2. Construir el AFND con transiciones nulas asociado 



3. Invertimos las transiciones 
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Teorema 7 Si L es aceptado por un Autómata Finito Determinístico entonces L puede generarse 
mediante una gramática lineal por la derecha y por una lineal por la izquierda. 

Demostración.- Sea L = L(M) donde M — (Q,A,b,q,F) es un autómata finito determinístico. 
Construiremos, en primer lugar, una gramática lineal por la derecha. 

La gramática que construimos es G = ( Q,A,P,qo ) donde las variables son los estados, la 
variable inicial es qo y P contiene las producciones, 

p^aq, si §(p,a)=q 


p —> 8, si p e F 

Para el caso de una gramática lineal por la izquierda, invertimos el autómata, construimos la 
gramática lineal por la derecha asociada e invertimos la parte derecha de las producciones. ■ 


Ejemplo 36 Consideremos el autómata: 



La gramática lineal por la derecha es (variable inicial qo): 

qo—^Oqi, qo —» lq2, qi^0q2, qi —> 1<?2 

q2^0qo, q2—>lqi, q2 ~> £ 

Si lo que queremos es una gramática lineal por la izquierda, entonces invertimos el autóma¬ 
ta: 



La gramática asociada es (variable inicial q 2 ): 
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<7i^O<?o, <72 —^ l<7o, <72 —►O#!, <72 —> l<7i 

(7o —>■ 0<72, (7i —> 1(72, (7o —► £ 

Invertimos la parte derecha de las producciones, para obtener la gramática lineal por la 
izquierda asociada: 

<7t —>< 7 oO, <72 * <7o 1 , (72— > <7i0, (?2 — ^ <7i 1 

(7o —^ <720, <7i—><72!, (7o 


2.6. Máquinas de Estado Finito 

Las máquinas de estado finito son autómatas finitos con salida. Veremos dos tipos de máqui¬ 
nas: 


- M áquinas de Moore: con salida asociada al estado 

- M áquinas de Mealy: con salida asociada a la transición 

Sin embargo, ambas máquinas son equivalentes, en el sentido de que calculan las mismas 
funciones. 

2.6.1. Máquinas de Moore 

Una máquina de Moore es una séxtupla 

{(Q,A,B, 8, X, <70)} donde todos los elementos son como en los autómatas finitos determinís- 
ticos, excepto 

- B alfabeto de salida 

- A,: Q —> B que es una aplicación que hace corresponder a cada estado su salida correspon¬ 
diente. 

No hay estados finales, porque ahora la respuesta no es ’acepta’ o ’no acepta’ sino que es 
una cadena formada por los símbolos de salida correspondientes a los estados por los que pasa 
el autómata. 

Si el autómata lee la cadena u y pasa por los estados qoqi...q n entonces produce la salida 
M<7o)M<7i) • • -^(<7n) 

Es conveniente señalar que produce una salida para la cadena vacía: X(qo). 
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n 


( 0 , 0 ) 


n 


( 0 , 1 ),( 1 , 1 ) 



u 


( 1 , 0 ),( 1 , 1 ) 
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Ejemplo 37 Control de semáforos en un cruce. Consideremos un cruce de carreteras, cuya 
estructura viene dada por la figura 37 

El tráfico importante va a estar en la carretera horizontal. La otra dirección es menos den¬ 
sa. Por eso se han puesto dos sensores, a y que mandan información sobre si hay coches 
esperando en las colas de los sem áforos 2 y 4 respectivamente: 1 si hay coches esperando y 0 
si no hay coches. Estos semáforos solo se abrirán en el caso de que hay coches esperando en la 
cola. En caso contrario permanecer n cerrados. 

Este cruce va a ser controlado por una Máquina de Moore que lee los datos de los sensores: 
pares ( a , b ) donde a es la información del sensor ay b la información del sensor (i Las scdidas 
será n cuadruplas (ai, < 22 , < 23 , af) donde a¡ £ {R.A.V} indicando como se colocan los sem foros. 

El esquema de una máquina de Moore que controla el tráfico es el de la figura anterior. 
Junto a cada estado se especifica la scdida correspondiente a dicho estado. 

2.6.2. Máquinas de Mealy 

Una Máquina de Mealy es también una séxtupla M — (Q,A,B,8,X,qo) donde todo es igual 
que en las máquinas de Moore, excepto que X es una aplicación de Q x A en B, 

X-.QxA^B 

es decir, que la salida depende del estado en el que está el autómata y del símbolo leido. 

Si la entrada es a\...a n y pasa por los estados qo,q\, ■ .. : q n , la salida es 

X(q 0 ,ai)X{qi,a 2 ) ■ ■ ■ X(q n — \,a n ) 

Si se le suministra £ como entrada produce £ como salida. 

Ejemplo 38 Supongamos una máquina codificadora que actúa de la siguiente forma: 

El alfabeto de entrada es {0,1} y el de salida {0,1}. La traducción viene dada por las 
siguientes reglas, 

- Primer símbolo 

0^0 

1 -> 1 


- Siguientes símbolos 


• Si el anterior es un 0 




68 


Modelos de Computación I 



Figura 2.13: Máquina de Mealy que realiza la división entera por 3 


• Si el anterior es un 1 


0 -> 1 
1 ->0 


La máquina de Mealy que realiza esta codificación es la siguiente 



si lee 0101, la salida correspondiente es 0111. 

Ejemplo 39 Una máquina de Mealy que realiza la división entera por 3 es el de la figura 2.13. 


2.6.3. Equivalencia de Máquinas de Mealy y Máquinas de Moore 

Una máquina de Mealy y una máquina de Moore calculan funciones aná logas. Sea M una 
máquina de Moore y M’ una máquina de Mealy. Si notamos como TM(u)yT^¡(u) las salidas que 
producen ante una entrada u, entonces se puede comprobar que siempre, \Tm(u)\ — |7^(w)| + l. 
Luego, en sentido estricto, nunca pueden ser iguales las funciones que calculan una máquina 
de Mealy y una máquina de Moore. Sin embargo, la primera salida de una máquina de Moore 
es siempre la misma: la correspondiente al estado inicial. Si despreciamos esta salida, que es 
siempre la misma, entonces si podemos comparar las funciones calculadas por las máquinas de 
Mealy y de Moore. 
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Definición 39 Una máquina de Moore, M, y una máquina de Mealy, M\ se dicen equivalentes 
sii paratodo u G A* T^{u) = bT M i(u) donde b es la salida correspondiente al estado inicial de 
la máquina de Moore M. 

Teorema 8 Dada una máquina de Moore, existe una máquina de Mealy equivalente. 

Demostración.- Sea M = ( Q,A,B,b,X,qo ) una máquina de Moore, la máquina de Mealy equi¬ 
valente ser áilí' = (2,A,R,8,V ,qo), donde 

\!{q,a) — ^(8(<?,a)) 

Es decir se le asigna a cada transición la salida del estado de llegada en la máquina de Moore. 
Es inmediato comprobar que ambas máquinas son equivalentes. 


Teorema 9 Dada una máquina de Mealy, existe una máquina de Moore equivalente 

Demostración.- Sea M = (Q,A,B, 8,X,^o) una máquina de Mealy. 

La máquina de Moore será: M = ( Q',A,B , donde 

■ Q' = Q*B 

■ ^{(q,b),a) = { 6 (q,a),X{q,a)) 

■ X'(q,b) = b 

■ q' Q — (qo, b ), donde b G R, cualquiera. 


Ejemplo 40 Dada la máquina de Mealy de la figura 2.13, aplicando el procedimiento del teo¬ 
rema anterior, obtenemos la máquina de Moore equivalente de la figura 2.14. 
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n° 



Figura 2.14: Máquina de Moore que realiza la división entera por 3 
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3.1. Lema de Bombeo 

A los lenguajes aceptados por un AFD se les llama también conjuntos regulares. El lema 
de bombeo se usa para demostrar que un determinado conjunto no es regular, es decir, no puede 
llegar a ser aceptado por un autómata finito determinístico. 

Lema 1 (Lema de Bombeo) Sea L un conjunto regular, entonces existe un n <E N tal que Vz G L, 
si |z| > n, entonces z se puede expresar de la forma z = uvw donde 

1. \uv\ < n 

2. | v | > 1 

3. (Vz > 0)uv l w G L 

además n puede ser el número de estados de cualquier autómata que acepte el lenguaje L. 
Demostración. - 

Sea M un autómata finito determinístico que acepta el lenguaje L. 

Supongamos que el conjunto de estados es Q — {qo,q \,• • -,qk}- 
Hagamos n — k+ 1. 

Entonces siz£Ly\z\>n = k+l resulta que z tiene, al menos, tantos símbolos como estados 
tiene el autómata. 

Cuando el autómata lee la palabra z, realiza un cambio de estado por cada símbolo de dicha 
palabra, empezando en qo y terminando en un estado final q m . 

Sea z! la parte de z constituida por los n primeros símbolos de z. Consideremos el vector de 
los estados por los que ( qi 0 ,q ¡ l ,..., q¡ n ) donde q¿ 0 es el estado inicial, qo, y qi } — 8(^_ 1 , aj). 

Como el vector {qt^qq ,..., q¡ n ) tiene n + 1 estados y sólo hay n estados distintos, tiene que 
haber necesariamente un estado que se repita. Sea q¡ el primer estado que se repite en este vector. 
Entonces consideramos: 

■ Sea u la parte de la palabra z! que lleva al autómata desde c¡q a la primera aparición de q¡. 

■ Sea v la parte de la palabra de z', que lleva el autómata de la primera aparición de q¡ a la 
segunda aparición de q¡. 

■ Sea w lo que le falta a uv para completar la palabra z. 

Con esta partición se puede probar: 


1. z — uvw 
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2. \uv\ < n, porque uv forman parte de z' que sólo tiene n símbolos. 

3. |v| > 1, porque para pasar de la primera aparición de q¡ a la segunda, hay que leer al menos 
un símbolo. 

4. uVw G L, Vi G N. En efecto, esta palabra es aceptada por el autómata, porque u lleva al 
autómata del estado inicial qo al estado q¡. Cada aparición de v mantiene al autómata en 
el mismo estado q¡ . Por último, w lleva al autómata desde q¡ al estado final q m . Como 
después de leer uVw llegamos a un estado final, entonces la palabra es aceptada por el 
autómata y pertenece al lenguaje L. 

Con esto queda demostrado el lema. ■ 

Para demostrar que un determinado lenguaje no es regular, basta probar que no se verifica la 
condición que aparece en el lema de bombeo. Para ello hay que dar los siguiente pasos: 

1. Suponer un n G N arbitrario que se suponga cumpla las condiciones del lema. 

2. Encontrar una palabra, z (que puede depender de ri) de longitud mayor o igual que n para 
la que sea imposible encontrar una partición como la del lema. 

3. Demostrar que una palabra z no cumple las condiciones del lema, para lo que hay que 
hacer: 

a) Suponer una partición arbitraria de z, z — uvw, tal que \uv\ < n, |v| > 1. 

b) Encontrar un i G N tal que uv l w L. 

Ejemplo 41 Demostrar que el lenguaje L = { 0 k 1 k : k > 0} no es regular. 

1. Supongamos un n cualquiera 

2. Sea la palabra 0" 1 " que es de longitud mayor o igual que n 

3. Demostremos que ()" 1" no se puede descomponer de acuerdo con las condiciones del 
lema: 

aj Supongamos una partición arbitraria de 0"1" = uvw. con \uv\ <ny |v| > 1. 

Como \uv\ < n resulta que v está formada de 0 solamente y como |v| > 1, v tiene, al 


menos un cero. 
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b) Basta considerar i — 2 y 

uv 2 w — uvvw = 0' ! vl' ! y esta no es una palabra de L, ya que si v tiene solo ceros, no 
hay el mismo número de ceros que de unos, y si v tiene ceros y unos, z. tendrá unos 
antes de algún cero. 

Con esto es suficiente para probar que L no es regular. Un resultado mucho mas difícil de 
encontrar directamente. 

•2 

Ejemplo 42 Demostrar que el lenguaje L = {O- 7 : j > 0 } no es regular. 

2 

Sea un n E N, consideremos la palabra z — 0" E Ly de longitud mayor o igual a n. 
Supongamos una descomposición cualquiera z — uvw. Si se verifica 

■ \uv\ < n 

■ M > 1 

entonces tenemos que u = 0 k ,v — 0 l ,w = 0 ,r ^'^ k , con l > 1,1 < n. 

Haciendo i = 2 ,uv 2 w = 0 k 0 2l 0 n2 ~ l ~ k = 0" 2+/ . 

Como {n + l) 2 — n 2 — n 2 + 2n + 1 — n 2 — 2n + 1 > n > l, tenemos que n 2 <n 2 + 1 < (n + 1) 2 

y UV 2 W = 0" 2+l f L. 

Con esto el lenguaje no puede ser regular. 

Ejemplo 43 El lenguaje {u E {0,1}* : u — t/ -1 } no es regular. 

Sea un Vn E N cualquiera. Consideremos la palabra z = 0” 10" E L y que tiene longitud 
2n + 1 > ?7. 

Supongamos una descomposición cualquiera: z = uvw. 

Si se verifica 

■ \uv\ < n 

■ |v| > 1 

entonces tenemos que u = 0 k ,v — 0 1 ,w = 0 w_fc_/ l"0", con l > 1. 

Haciendo i = 2, uv 2 w = 0 k 0 2l 0 n - k ~l \ n 0 n = 0 n+I l n 0 n (f L. 

Como hemos encontrado un i tal que uv l w f L, tenemos que el lenguaje no verifica la con¬ 
dición que aparece en el lema de bombeo y no puede ser regular. 

Hay lenguajes que no son regulares y sin embargo verifican la condición que aparece en el 
lema de bombeo. A continuación se da un ejemplo de este caso. 

Ejemplo 44 Sea L = {a'bú k : (i — 0) V (j — k)} un lenguaje sobre el alfabeto A = {a,b,c}. 
Vamos a demostrar que se verifica la condición del lema de bombeo para n = 2. 

En efecto si z E L y \z\ > 2 entonces z = a'b J z k con i = 0 o j = k. Caben dos posibilidades: 
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a) i = 0. En este caso z. 
forma: 


bh: k una descomposición de z se puede obtener de la siguiente 


u — £ 

v es el primer símbolo de z 
w es z menos su primer símbolo 


Está claro que se verifican las tres condiciones exigidas en el lema de bombeo. 

1. \uv\ — \<n — 2 

2. | v | = 1 > 0 

3. Si l > 0 entonces uv l w sigue siendo una sucesión de b seguida de una sucesión de c 
y por tanto una palabra de L. 

b) i > 0. En ese caso z. — ab J c J , y una partición de esta palabra se obtiene de acuerdo con lo 
siguiente: 


u = e 

v — a es el primer símbolo de z 
w es z menos su primer símbolo 


También aquí se verifican las tres condiciones: 

1. \uv\ = 1 < n = 2 

2. | v | = 1 > 0 

3. Si l > 0 entonces uv l w sigue siendo una sucesión de a seguida de una sucesión de b 
y otra de c, en la que la cantidad de b es igucd que la cantidad de c, y por tanto, una 
palabra de E. 


Es fácil intuir que este lenguaje no es regular, ya que el número de estados necesarios para tener 
en cuenta el número de ay de b puede hacerse ilimitado (y no sería finito). 
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3.2. Operaciones con Conjuntos Regulares 

Ya conocemos las siguientes propiedades, 

■ Unión: Si L\ y L 2 son conjuntos regulares, entonces L\ UL 2 es regular. 

■ Concatenación: Si L\ y L 2 son regulares, entonces L1L2 es regular. 

■ Clausura de Kleene: Si L es regular, entonces L* es regular. 

Adicionalmente, vamos a demostrar las siguientes propiedades. 

Proposición 1 Si L C A* es un lenguaje regular entonces L = A* — L es regular. 

Demostración.- Basta con considerar que si M = (Q,A,8,qo,F) es un autómata finito determi- 
nístico que acepta el lenguaje L, entonces M' — (Q,A,8,qo,Q — F) acepta el lenguaje comple¬ 
mentario A* —L. ■ 


Proposición 2 Si L\ y L 2 son dos lenguajes regulares sobre el alfabeto A, entonces L\ flL 2 es 
regular. 

Demostración. - _ 

Es inmediato ya que L\ FL2 — (. L\ CLf). 

Existe también una demostración constructiva. Si M\ — (< 2 i,A,8i,g¿,Fi) es un autómata 
finito determinístico que acepta L\, y M2 = (225^,82,^0^2) es un autómata que acepta L2, 
entonces 

M=(Q\X Q 2: A,b,{q l 0 ,ql),Fi x F 2 ) 

donde 8((q¡,qj),a) — (8(qi,a), 8(qj,a)), acepta el lenguaje L\ FL 2 . ■ 


Proposición 3 Si Ay B son alfabetos y f : A* —> B un homomorfismo entre ellos, entonces 
si L C A* es un lenguaje regular, f{L) — {u G B : 3 v G A verificando f(v ) = u\ es también un 
lenguaje regular. 

Demostración. - 

Basta con comprobar que se puede conseguir una expresión regular para f(L) partiendo de 
una expresión regular para L: Basta con substituir cada símbolo, a, de L, por la correspondiente 
palabra/(a). ■ 
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Ejemplo 45 Si A = {0,1,2,3,4,5,6,7,8,9} y B = {0,1} y f es el homomorfismo dado por 
/(O) =0000, /(l) = 0001, /(2) = 0010, /(3) =0011 
/(4) = 0100 , /(5) = 0101, /( 6 ) = 0110, /(7) =0111 
/( 8 ) = 1000, /(9) = 1001 

Entonces si L CA* es el lenguaje regular dado por la expresión regular (1 + 2) *9, entonces 
el lenguaje f(L ) también es regular y viene dado por la expresión regular (0001 +0010) *1001. 

Proposición 4 Si Ay B son alfabetos y f : A* — > B es un homomorfismo, entonces si L C B* 
es un conjunto regular, también lo es f~ 1 (L) = {u G A : /'(«) G L}. 

Demostración. - 

Supongamos que M = (Q,B,8,qo,F) es un autómata que acepta el lenguaje L, entonces el 
autómata M— ( Q,A,8,qo,F ) donde 


acepta el lenguaje / 1 (L). 


&(q,a) — 8\q,f(a)), 


Ejemplo 46 Si A = B — {0,1} y f es el homomorfismo dado por 

m =oo, /(i) = ii 

entonces el lenguaje F = { 0 2k 1 2k : k > 0} no es regular, porque si lo fuese su imagen inversa, 
/-■(£) = {0*1*:* > 0} sería también regular y no lo es. 

Proposición 5 Si R es un conjunto regular y F un lenguaje culaquiera, entonces el cociente de 
lenguajes R/F = {u : 3v G L verificando uv G R} es un conjunto regular. 

Demostración. - 

Sea M — (Q,A, 8, qo,F) un autómata finito determinístico que acepta el lenguaje R. 
Entonces R/F es aceptado por el autómata 

M' = (Q,A,8,q 0 ,F') 

donde F 1 — {q e Q : 3y e L tal que 8 \q,y) G F} 

Esta demostración no es constructiva, en el sentido de que puede que no exista un algoritmo 
tal que dado un estado q G Q nos diga si existe una palabra y G L tal que 8(q,y) G F. Si L es 
regular, se puede asegurar que dicho algoritmo existe. 
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3.3. Algoritmos de Decisión para Autómatas Finitos 

El lema de bombeo sirve para encontrar algoritmos de decisión para los autómatas finitos, 
por ejemplo, para saber si el lenguaje que acepta un determinado autómata es vacío o no. 

Teorema 10 El conjunto de palabras aceptado por un autómata finito con n estados es 

1. No vacío si y solo si existe una palabra de longitud menor que n que es aceptada por el 
autómata. 

2. Infinito si y solo si acepta una palabra de longitud l, donde n < l < 2 n. 

Demostración. - 

1. La parte si es evidente: si acepta una palabra de longitud menor o igual que n, el lenguaje 
que acepta no es vacío. 

Para la parte solo si, supongamos que el lenguaje aceptado por un autómata es no vacío. 
Consideremos una palabra, u, de longitud mínima aceptada por el autómata. En dicho 
caso, \u\ < n, porque si \u\ > n, entonces por el lema de bombeo u — xyz, donde \y\ > 1 
y xz es aceptada por el autómata, siendo \xz\ < \u\, en contra de que u sea de longitud 
mínima. 

2. Si u € L(M) y n < \u\ < 2/?, entonces por el lema de bombeo se pueden obtener infinitas 
palabras aceptadas por el autómata y L(M) es infinito. 

Reciprocamente, si L(M) es infinito, habrá infinitas palabras de longitud mayor o igual 
que 77. Sea u una palabra de longitud mínima de todas aquellas que tienen de longitud 
mayor o igual que n. 

Entonces, u ha de tener una longitud menor de 2 n, porque si no es así, por el lema 

de bombeo, u se puede descomponer u — xyz, donde 1 < \y\ < n, y xz E L(M) . Por tanto, xz 
sería aceptada por el autómata, tendría una longitud mayor o igual que n, y tendría menos 
longitud que u. En contra de que u sea de longitud mínima. 


Este teorema se puede aplicar a la construcción de algoritmos que determinen si el lenguaje 
aceptado por un autómata es vacío o no, y para ver si es o no finito. Para lo primero se tiene 
que comprobar si el autómata acepta alguna palabra de longitud menor o igual que n. Para lo 
segundo si acepta una palabra de longitud mayor o igual que n y menor que 2 n. Como en ambos 
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casos, el número de palabras que hay que comprobar es finito, estos algoritmos siempre paran. 
Sin embargo, en general será n ineficientes. 

Existe otro procedimiento más eficiente para determinar si el lenguaje asociado a un autóma¬ 
ta finito determinístico es o no finito. Lo vamos a explicar en función del diagrama de transición 
asociado. Consiste en eliminar previamente todos los estados que son inaccesibles desde el esta¬ 
do inicial (un estado es inaccesible desde el estado inicial si no existe un camino dirigido entre 
el estado inicial y dicho estado). Después de eliminar los estado inaccesibles se obtiene un autó¬ 
mata finito determinístico que acepta el mismo lenguaje que el inicial. Si en dicho autómata 
queda algún estado final, el lenguaje aceptado por el autómata no es vacío. Es vacío si no queda 
ningún estado final. 

Para comprobar si es o no finito, se eliminan además los estados desde los que no se puede 
acceder a un estado final y las transiciones asociadas. Se obtiene así un autómata finito que 
puede ser no determinístico y que acepta el mismo lenguaje que el original. El lenguaje aceptado 
será infinito si y solo si existe un ciclo en el diagrama de transición del nuevo autómata. 

Teorema 11 Existe un algoritmo para determinar si dos autómatas finitos determinístico s acep¬ 
tan el mismo lenguaje. 

Demostración. - 

Sean M\ y Mi dos autómatas finitos determinísticos. Entonces de forma algorítmica se puede 
construir un autómata, M, que acepte el lenguaje 

L(M) = {L{M\) rUjMij) U (L(Mi)nL(M 2 )) 

Entonces el comprobar si L{M\) — L(M 2 ) es equivalente a comprobar si L(M ) ^ 0, lo cual 
se puede hacer también de forma algorítmica. ■ 


3.4. Teorema de Myhill-Nerode. Minimización de Autómatas 

Sea L C A* un lenguaje arbitrario. Asociado a este lenguaje L podemos definir una relación 
de equivalencia Ri en el conjunto A, de la siguiente forma: 

Si x,y G A*, entonces ( xRpy ) si y solo si (Vz G A*, (xz G L yz G L)) 

Esta relación de equivalencia dividirá el conjunto A* en clases de equivalencia. 

El número de clases de equivalencia se llama índice de la relación. 

Ejemplo 47 Sea L = 0* 10*, entonces tenemos que 


00R l 000 




80 


Modelos de Computación I 



Figura 3.1: Autómata que acepta el lenguaje L 


00\R l \ 

01 AlO 
1LK¿101 

También se puede definir una relación de equivalencia, Rm, en A* asociada a un autómata 
finito determinístico M — (Q.A, 8, qo, F) cualquiera de la siguiente forma. 

Si u,v E A*, entonces uRmv si y solo si (8'(qo,u) — 8'(qo,v)) 

Esta relación de equivalencia divide también el lenguaje A en clases de equivalencia. 

Ejemplo 48 Consideremos el autómata de la Figura 3.1, que acepta el mismo lenguaje, L, del 
ejemplo anterior. Ahora tenemos que 


OO/óv/OOOO 

OOlO/ówOOOK) 

OORmOOOO 

0010R m 00010 

pero Ri y Rm no son exactamente la misma relación de equivalencia. 

Por ejemplo, ()()()R¡ 00 pero 000 /A/00. 

En general, esto se va a verificar siempre. Si tenemos un lenguaje regular L y un autómata 
finito determinístico M que acepta este lenguaje entonces, 


uRmv uRlv 
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pero la implicación inversa no se va a verificar siempre. Solo, como veremos más adelante, para 
los autómatas minimales. 

El índice (n. de clases de equivalencia) de R será a lo más el número de estados del autómata 
finito que sean accesibles desde el estado inicial. En efecto, si q G Q, y este estado es accesible, 
entonces definirá una clase de equivalencia: 

[<7] = &(qo,x) = q} 

Esta clase es no vacía ya que 3x G A tal que b'(qo,x) — q (q es accesible desde qo). 

Definición 40 Una relación de equivalencia R en A* se dice que es invariante por la derecha 
para la concatenación si y solo si (( uRv ) (Vz G A* ,xzRyz)). 

Proposición 6 - Sea L C A*, entonces Ri es invariante por la derecha. 

- Si M es un autómata finito, entonces Rm es invariante por la derecha. 

El siguiente teorema es la base para la construcción de autómatas finitos minimales. 

Teorema 12 (Teorema de Myhill-Nerode) Si LUA* entonces las tres siguientes afirmaciones 
son equivalentes 

1. L es aceptado por un autómata finito 

2. L es la unión de algunas de las clases de equivalencia de una relación de equivalencia en 
A* de índice finito que sea invariante por la derecha. 

3. La relación de equivalencia R¡ es de índice finito. 

Demostración. - 

Demostraremos 1 =>■ 2 =>■ 3 1. 

1 =>■ 2 Si M es un autómata finito determinístico que acepta el lenguaje L. Entonces la 

relación de equivalencia R M tiene un número finito de clases de equivalencia (tantos como 
estados accesibles desde el estado inicial tenga M) y además es invariante por la derecha. 

Solo hay que probar que siendo [x\m la clase de equivalencia asociada ax( [x]m — 
{y: xRmv} entonces 


L = (J [x\ M 

8(qo,x)eF 
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2 =>■ 3 Sea R la relación de equivalencia que verifica 2. Vamos a probar que 


xRy => xRiy 

En efecto, si xRy, entonces si z G A*, por ser R invariante por la derecha, tenemos que 
xzRyz. Es decir, xz : yz pertenecen a la misma clase de equivalencia. Como L es la unión de 
ciertas clases de equivalencia de la relación R , entonces todos los elementos de una misma 
clase pertenecen o no pertenecen al mismo tiempo al lenguaje L. De esto se deduce que 

xz G L y^yz G L. 

En conclusión, si xRy, entonces para todo z G A*, se tiene que xz G L yz G L. Por tanto 
xR L y. 

Una vez demostrado esto, veremos que R¿ tiene memos clases de equivalencia que R. Más 
concretamente, veremos que si [x\r = [y] r entonces [jc]¿ = [y]¿- Pero esto es inmediato, ya 
que si [x]r = [y]/{, entonces xRy. Y acabamos de demostrar que de aquí se deduce que 
xR L y. Y por tanto, [x] L = [y] L . 

Por último, como R es de índice finito y tiene menos clases que R, se deduce que es 
de índice finito. 

3 =4» 1 Construiremos un autómata a partir de la relación 
El autómata ser áM = ( Q,A,8,qo,F ), donde 

- 2 = {[*] :x GA*} 

- b([x] L ,a) = [xa\ L 

Esta definición es consistente ya que, siendo R L invariante por la derecha, si [x]i = 
[y] l entonces [xa] l = [ya]¿. 

- <70 = [z]l, 

- F = {[x]¿ : x G L}. 

F está bien definido, ya que si [x]i — [y]¿, entonces xR^y, y por tanto, x£ G L ye G 
L, es decir, x e y e L. 

Este autómata acepta el lenguaje L. En efecto, 8(go,x) = [x\l y [x\l GF<^jcG¿. Por tanto 
una palabra jc G A* es aceptada cuando x G L. 
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1 


1 


Figura 3.2: Autómata asociado a la relación R L 




Ejemplo 49 Si consideramos el lenguaje L dado por la expresión regular 0*10*, entonces la 
relación Ri divide al conjunto de las cadenas en tres clases de equivalencia: 

[e]l = Ci, [1 ]l = C 2 , [11]l = C 3 

Si consideramos el autómata asociado a este lenguaje (ver Fig. 3.1), este autómata divide 
A* en seis clases de equivalencia. 

C a = (00)* C h = 0(00)* C c = (00)* 1 

C d = (00)*01 C e = 0*100* Cf = 0*10*1(0+1)* 

L — C c UQU C e , la unión de las tres clases correspondientes a los estados finales. 

De acuerdo con el teorema anterior, con la relación de equivalencia R¿ podemos construir 
un autómata finito que acepta el mismo lenguaje L. Este autómata viene dado por el diagrama 
de transición de la figura 3.2, 

3.4.1. Minimización de Autómatas 

Definición 41 Un autómata finito determinístico se dice minimal si no hay otro autómata finito 
determinístico que acepte el mismo lenguaje y tenga menos estados que el. 

En el ejemplo que vimos después del teorema de Myhill-Nerode, a partir de la relación 
R¿ asociada a un lenguaje L, construimos un autómata que aceptaba ese lenguaje y que tenía 
pocos estados. En particular tenía menos estados que el autómata original. El siguiente teorema 
demuestra que es precisamente un autómata minimal. 

Teorema 13 Si L es un conjunto regular y R¡ la relación de equivalencia asociada, entonces el 
autómata construido en el teorema anterior es minimal y único salvo isomorfismos. 

Demostración. - 

Comprobaremos únicamente que es minimal. 

En efecto, si M' es el autómata construido según el teorema anterior y M un autómata cual¬ 
quiera que acepta el lenguaje L entonces tenemos que se verifica 


xR^y =>- xRy 
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Por tanto R¿ tiene menos clases que Rm- 

El teorema queda demostrado si tenemos en cuenta que: 

N. de estados de M > N. de clases de Rm > N. de clases de R ¿ = N. de estados de M' 


El teorema anterior nos permite encontrar el autómata minimal asociado a un lenguaje, par¬ 
tiendo de la relación de equivalencia de dicho lenguaje. El problema fundamental es que normal¬ 
mente no tenemos dicha relación y normalmente no es fácil de calcular. Lo que solemos tener 
es un autómata finito determinístico que acepta el lenguaje L y lo que nos interesa es transfor¬ 
marlo en un autómata minimal. Esto se puede hacer de forma algorítmica. El procedimiento de 
minimización está basado en el hecho de que los estados del autómata minimal construido a 
partir de la relación Ri están formados por uniones de estados de un autómata M cualquiera que 
acepte el mismo lenguaje. Los estados que se pueden identificar y unir en un solo estado son los 
llamado estados indistinguibles, que se definen a continuación. 

Definición 42 Si M — (Q.A.S.qo. F) es un autómata finito determinístico y q¡,qj son dos esta¬ 
dos de Q, se dice que q¡ y qj son indistinguibles si y solo si V« <EÁ*. S'U/í- u) G F 8 '(qj, u) G F. 

Es decir, es indiferente estar en dos estados indistinguibles para el único objetivo que nos 
interesa: saber si vamos a llegar a un estado final o no. 

El siguiente algoritmo identifica las parejas de estados indistinguibles. Supone que no hay 
estados inaccesibles. 

Para el algoritmo, asociaremos a cada pareja de estados accesibles del autómata una variable 
booleana: marcado, y una lista de parejas. Al principio todas las variables booleanas están a 
falso y las listas vacías. Los pasos del algoritmo son como siguen, 

1. Eliminar estados inaccesibles. 

2. Para cada pareja de estados accesibles {qi,qj} 

3. Si uno de ellos es final y el otro no, hacer la variable booleana 
asociada igual a true. 

4. Para cada pareja de estados accesibles {<?/,<?;} 

5. Para cada símbolo a del alfabeto de entrada 

6. Calcular los estados qk y qi a los que evoluciona el 
autómata desde q¡ y qj leyendo a 

7. Si qk qi entonces 

8. Si la pareja {qk,qt} está marcada entonces se 

marca la pareja {q¡,qj} y recursivamente se marcan también todas 
las parejas en la lista asociada. 

9. Si la pareja {qi^qi} no está marcada, se añade la pareja 
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{qi,qj} a la lista asociada a la pareja {qk,qi}- 


Al final del algoritmo, todas las parejas de estados marcados son distinguibles y los no mar¬ 
cados indistinguibles. 

Una vez identificados los estados indistinguibles, el autómata minimal se puede construir 
identificando los estados indistinguibles. Más concretamente, si el autómata original es M — 
( Q,A , 8, qo,F), R es la relación de equivalencia de indistinguibilidad entre estados y [q] la clase 
de equivalencia asociada al estado q, entonces el nuevo autómata, M m — (Q,„.A. 8,„, q™. F m ) tiene 
los siguientes elementos, 

- Qm = {[<?]: q es accesible desde ( 70 } 

- Fm = {[q] -q^F} 

- 5 m ([q],a) = [b(q,a)] 

- q'o = [qo] 

Se puede demostrar el siguiente teorema. 

Teorema 14 Si M es un autómata finito determinístico sin estados inaccesibles, el autómata 
M m construido anteriormente es minimal. 

Ejemplo 50 Minimizar el autómata de la Figura 3.3. 

Primero eliminamos el estado inaccesible d y obtenemos el autómata de la figura ??. A 
continuación organizamos los datos del algoritmo en una tabla triangular como la de la Figura 
3.5. En las casillas vamos anotando la lista asociada a cada pareja y si están o no marcadas. 

El resultado se puede ver en la tabla 3.6. Esta nos indica que los estados ay e son equivalen¬ 
tes, así como los estados b y h: a = e. b = h. Identificando estos estados, obtenemos el autómata 
de la figura 3.7. 
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Figura 3.4: Autómata para minimizar, después de eliminar estados inaccesibles. 



Figura 3.5: Tabla de minimización de autómata 
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X 
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X 
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X 

X 




f 

X 

X 
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X 

X 

X 
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h 

X 

(e,a) 

X 

X 

X 

X 


a b c e f g 


Figura 3.6: Estado final de la tabla de minimización de autómata 



Figura 3.7: Autómata minimal 
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Figura 4.1: Arbol de Derivación 

4.1. Arbol de Derivación y Ambigüedad 

Consideremos una gramática G — ( V,T,P,S ) donde V — {S},r = {a, ¿>,c,0,£, (,),*,+} y 
las producciones son 
S —■> a|¿|c|0|e 
5^ (S + S) 

(S*S) 

Esta es una gramática libre de contexto: En la parte izquierda de las producciones solo apa¬ 
rece una variable. Al lenguage generado por esta gramática pertenece la palabra ((a + b)*c). 
Solo hay que aplicar la siguiente cadena de producciones 

(5*5) =r- ((5 + 5) *5) =>- ((a + 5) *5) =>- ((a + b) * 5) =r- ((a + ¿) * c) 

Una palabra nos puede ayudar a determinar si una palabra pertenece a un determinado len¬ 
guaje, pero también a algo más: a determinar la estructura sintáctica de la misma. Esta viene 
dada por lo que llamaremos árbol de derivación. Este se construye a partir de la cadena de deri¬ 
vaciones de la siguiente forma. Cada nodo del árbol va a contener un símbolo. En el nodo raíz 
se pone el símbolo inicial 5. 

Entonces, si a este nodo se le aplica una determinada regla 5 —> a , entonces para cada 
símbolo que aparezca en a se añade un hijo con el símbolo correspondiente, situados en el orden 
de izquierda a derecha. Este proceso se repite para todo paso de la derivación. Si la derivación se 
aplica a una variable que aparece en un nodo, entonces se le añaden tantos hijos como símbolos 
tenga la parte derecha de la producción. Si la parte derecha es una cadena vacía, entonces se 
añade un solo hijo, etiquetado con £. En cada momento, leyendo los nodos de izquierda a derecha 
se lee la palabra generada. 

En nuestro caso tenemos el árbol de derivación de la Figura 4.1. 

Un árbol se dice completo cuando todas las etiquetas de los nodos hojas son símbolos 
terminales o bien la cadena vacía. 
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Figura 4.2: Arbol de Derivación de aabbaa 


Ejemplo 51 Consideremos la gramática 


S —> aAS, S 


a , A 


SbA, A —> SS, A —> ba 


y la palabra aabbaa. Esta palabra tiene una derivación que tiene asociado el árbol de la Figura 
4.2 


Aunque toda cadena de derivaciones lleva asociado un solo árbol, éste puede provenir de 
varias cadenas de derivaciones distintas. Sin embargo, siempre se pueden distinguir las siguien¬ 
tes: 


■ Derivación por la izquierda. - Cuando en cada paso siempre se sustituye primero la prime¬ 
ra variable (más a la izquierda) de la palabra que tenemos. 

■ Derivación por la derecha.- Cuando en cada paso siempre se sustituye primero la última 
variable (más a la derecha) de la palabra que tenemos. 

Ejemplo 52 Al árbol de derivación de la palabra aabbaa, le corresponden las siguientes deri¬ 
vaciones: 

■ Derivación por la izquierda: 

S =>• aAS => aSbAS =>- aabAS aabbaS =>■ aabbaa 


■ Derivación por la derecha: 


S aAS => aAa aSbAa aSbbaa aabbaa 
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S 


A 

a 



A A 

a a 




a a 


A 

a 


Figura 4.3: Dos árboles de derivación para a 5 

La existencia en una gramática de varias derivaciones para una misma palabra no produce 
ningún problema, siempre que den lugar al mismo árbol. Sin embargo, existe otro problema que 
si puede ser más grave: la ambigüedad. Una gramática se dice ambigua si existen dos árboles 
de derivación distintos para una misma palabra. Esto es un problema, ya que la gramática no 
determina la estructura sintáctica de los elementos de la palabra, no determina como se agrupan 
los distintos elementos para formar la palabra completa. 

Ejemplo 53 La gramática, 


S —* AA, A —> aSa, A —> a 

es ambigua: la palabra a 5 tiene dos árboles de derivación distintos (ver Fig. 4.3). 

Es suficiente que haya una palabra con dos árboles de derivación distintos para que la gra¬ 
mática sea ambigua. 

El lenguaje generado por esta gramática no es inherentemente ambiguo. Esto quiere decir 
que existe otra gramática de tipo 2 no ambigua y que genera el mismo lenguaje. El lenguaje 
generado es { a 2+3i : i > 0} y otra gramática no ambigua que también geneta este lenguaje es 

S —* aa , S —> aaU , U —► aaaU , U —> aaa 
Aquí a solo tiene un árbol de derivación asociado (ver Fig. 4.4). 

Ejemplo 54 La gramática 

E I, E^I-E, E^E-I, I —> a\b\c\d 

es ambigua. Ea palabra a — b — c admite dos árboles de derivación (ver Fig. 4.5). 

Se puede eliminar la ambigüedad eliminando la producción E —»I — E. 
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S 




Figura 4.4: Arbol de derivación para a 5 

E 

E 

/\\ 

/\\ 

I - E 

E - I 

1 /l\ 

/W 1 

a I — E 

E - I c 

b 1 

I b 


c a 


Figura 4.5: Dos árboles de derivación para a — b — c 

Existen lenguajes inherentemente ambiguos, como es el siguiente 

L = {a n b n c m d m : n > 1 ,m > 1} U {a n b m c m d n : n > 1 ,m > 1} 

Este lenguaje es de tipo 2 o libre del contexto, ya que puede puede generarse por la gramática 
S —*• AB, A —> ab, A —> aAb, 

B —> cJ, i? —> 

5 —> aCJ, C —> aCd , C —> ¿>Dc, 

C —> be, D —> bDc , D ^ be 

Entonces la palabra aabbccdd puede tener dos derivaciones (ver Fig. 4.6). 

Aunque no lo demostraremos aquí esta ambigüedad no se puede eliminar. Pueden existir 
otras gramáticas de tipo 2 que generen el mismo lenguaje, pero todas será n ambiguas. 


4.2. Simplificación De Las Gramáticas Libres De Contexto 

Para un mismo lenguage de tipo 2 existen muchas gramáticas libres de contexto que lo 
generan. Estas será n de formas muy diversas por lo que, en general se hace muy difícil trabajar 
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d 




c 


Figura 4.6: Dos árboles de derivación para aabbccdd 


con ellas. Por este motivo interesa simplificarlas lo mas posible y definir unas formas normales 
para las gramáticas que las hagan mas homogéneas. 

4.2.1. Eliminación de Símbolos y Producciones Inútiles 

Un símbolo X e (V U T) se dice útil si y solo si existe una cadena de derivaciones en G tal 
que 


es decir si interviene en la derivación de alguna palabra del lenguaje generado por la gramática. 
Una producción se dice útil si y solo si todos sus símbolos son útiles. Esto es equivalente a que 
pueda usarse en la derivación de alguna palabra del lenguaje asociado a la gramática. Esta claro 
que eliminando todos los símbolos y producciones inútiles el lenguaje generado por la gramática 
no cambia. 

El algoritmo para eliminar los símbolos y producciones inútiles consta de dos pasos funda¬ 
mentales: 

1. Eliminar las variables desde las que no se puede llegar a una palabra de T y las produc¬ 
ciones en las que aparezcan. 

2. Eliminar aquellos símbolos que no sean alcanzables desde el estado inicial, S, y las pro¬ 
ducciones en las que estos aparezcan. 

El primer paso se realiza con el siguiente algoritmo (V’ es un conjunto de variables): 
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1. V' = 0 

2. Para cada producción de la forma A —> w, A se introduce en V'. 

3. Mientras V' cambie 

4. Para cada producción B —> a 

5. Si todas las variables de a pertenecen a V', 
i? se introduce en V 7 

6 . Eliminar las variables que esten en V y no en V’ 

7. Eliminar todas las producciones donde aparezca una 
variable de las eliminadas en el paso anterior 

El segundo paso se realiza con el siguiente algoritmo: 

- V" y 7 son conjuntos de variables. 7 son las variables por analizar. 

- T' es un conjunto de símbolos terminales 

1.7= {5} 

V" = {S} 

r = o 

2. Mientras 7^0 

3. Extraer un elemento de 7 : A, (7 = 7 — {A}). 

4. Para cada producción de la forma A —► a 

5.Para cada variable 7? en a 

6 . Si 7? no est en V" añadir B a 7 y a V" 

7. Poner todos los simbolos terminales de a en T' 

8 . Eliminar todas las variables que no esten en V" 

y todos los simbolos terminales que no esten en T'. 

9. Eliminar todas las producciones donde aparezca 
un simbolo o variable de los eliminado 

Ejemplo 55 Es importante aplicar los algoritmos anteriores en el orden especificado para que 
se garantice que se eliminan todos los símbolos y variables inútiles. Como ejemplo de lo ante¬ 
rior, supongamos que tenemos la gramática dada por 

S —* AB , S —> a, A —» a 

En el primer algoritmo se elimina B y la producción S —> AB. 

Entonces en el segundo se elimina la variable A y la producción A —» a. 

Sin embargo, si aplicamos primero el segundo algoritmo, entonces no se elimina nada. Al 
aplicar después el primero de los algoritmos se elimina By la producción S —> AB. En definitiva, 
nos queda la gramática 
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S —»• a, A —> a 

donde todavía nos queda la variable inútil A. 

Ejemplo 56 Eliminar símbolos y producciones inútiles de la gramática 

S —* §Ae } S-^aYB, S —> cY, 

A —■» bBY, A —> ooC, i? —> dd, 

B->D, C-^jVB, C —> gi, 

D^n, U^kW, V —> baXXX, 

V^oV, W^c, X -> fV, Y —> Yhm 

Primero se aplica el algoritmo primero. 

Inicialmente V' tiene las variables V' = {B. D.C. W}. 

En la siguiente iteración añadimos a V' las variables que se alcanzan desde estas: AyW. 
V' queda igual a {B,D,C,W,A,U}. 

En la siguiente V' = {5,Z),C, W,A,U,S}. 

En la siguiente V' — {B,D,C,W,A,U ,S}. 

Como V' no cambia ya se ha terminado el ciclo. Estas son las variables desde las que se 
alcanza una cadena de símbolos terminales. El restos de las variables: X.Y.V. son inútiles y se 
pueden eliminar. También se eliminan las producciones asociadas. La gramática resultante es: 

S —> gAe , A —> ooC , 

B —> dd , B —> D, C —■> gi, 

D —> n, U^kW, IV 

A esta gramática le aplicamos el segundo algoritmo 
J ={S},V" = {S}J' = ® 

Tomando S de J y ejecutando las instrucciones del ciclo principal nos queda 
J = {A},V" = {S,A},T' = {g,e} 

Tomando A de J, tenemos 
J — {C},V" = {S,A,C},T' = {g,e,o} 

Sacando C de J, obtenemos 
J = <b,V» = {S,A,C},T' = {g,e,o,i} 

Como 7 = 0 se acaba el ciclo. Solo nos queda eliminar las variables inútiles: B. D. U. W. los 
símbolos terminales inútiles: n.k. c.d. y las producciones donde estos aparecen. La gramática 
queda 
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S —» gAc, A —> ooC, C —> gi 

En esta gramática solo se puede generar una palabra: googige. 

Si el lenguaje generado por una gramática es vacío, esto se detecta en que la variable S 
resulta inútil en el primer algoritmo. En ese caso se pueden eliminar directamente todas las 
producciones, pero no el símbolo S. 

Ejemplo 57 eliminar símbolos y producciones inútiles de la gramática 

S —> aSb. S —> ab, S —> bcD, 


S —> cSE,E —> aDb. E —> abc,E —>• abF 

4.2.2. Producciones Nulas 

Las producciones nulas son las de la forma A —> £. Vamos a tratar de eliminarlas sin que 
cambie el lenguaje generado por la gramática ni la estructura de los árboles de derivación. 
Evidentemente si £ G L(G) no vamos a poder eliminarlas todas sin que la palabra nula deje de 
generarse. Así vamos a dar un algoritmo que dada una gramática G, construye una gramática 
G' equivalente a la anterior sin producciones nulas y tal que L(G') = L(G) — {e}. Es decir, si 
la palabra nula era generada en la gramática original entonces no puede generarse en la nueva 
gramática. Primero se calcula el conjunto de las variables anulables: 

H es el conjunto de las variables anulables 

1 .H = <d 

2. Para cada producción A —> £, se hace H — HU{A} 

3. Mientras H cambie 

4. Para cada producción B —»A 1 A 2 ... A,„ 

donde A ¡ g H para todo i — 1,..., n, se hace H — H U 


Una vez calculado el conjunto, H, de las variables anulables, se hace lo siguiente: 

1. Se eliminan todas las producciones nulas de la gramática 

2. Para cada producción de la gramática de la forma 

A —> ai... a„, donde a,- G V U T. 

3. Se elimina la producción A —> ai... a,, 

4. Se añaden todas las producciones de la forma A —> pi... 
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donde p, = a, si a, ^ H 

(P f = a f ) V (Pf = e) si a eH 

y no todos los p, puedan ser nulos al mismo tiempo 


G' es la gramática resultante después de aplicar estos dos algoritmos. 

Si G generaba inicialmente la palabra nula, entonces, a partir de G ', podemos construir una 
gramática G" con una sola producción nula y que genera el mismo lenguaje que G. para ello 
se añade una nueva variable, S 1 , que pasa a ser el símbolo inicial de la nueva gramática, G". 
También se añaden dos producciones: 


S' -> S, S' -»• £ 

Ejemplo 58 Eliminar las producciones nulas de la siguiente gramática: 

S —> ABb, S —■> ABC, C —» abC, 

B —» ¿>/?,/l —>• £, A —■» r/A, 

A —> £,C —> Ai? 

Las variables anulables después de ejecutar el paso 2 del primer algoritmo son B y A. Al 
ejecutar el paso 3, resulta que C y S son también anulables, es decir H = {A. /TC..S'}. Al ser 
S anulable la palabra vacía puede generarse mediante esta gramática. En la gramática que se 
construye con el segundo algoritmo esta palabra ya no se podrá generar. Al ejecutar los pasos 
3 y 4 del segundo algoritmo para las distintas producciones no nulas de la gramática resulta 

3. Se elimina la producción S —■> ABb 

4. Se añade S —» ABb, S —■> Ab, S —> Bb 

3. Se elimina S —> ABC 

4. Se añade S —» ABC, S —» AB, S —■> AC, 

S^BC,S^A,S^B,S^C 

3. Se elimina C —> abC 

4. Se añade C —> abC, C —> ab 

3. Se elimina B —? bB 

4. Se añade B —> B —>■ b 

3. Se elimina A —> c/A 

4. Se añade A —> aA, A —>• a 

3. Se elimina C —> A/1 
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4. Se añade C —> Ai ?,C —> A,C —> B 

En definitiva, la gramática resultante tiene las siguientes producciones: 

S-^ABb, S —>Ab, S —> Bb, S^ABC, S^AB, 

S —> AC, S->fíC, S 1 —► A, S^C, 

C —> C —>• a¿>, i? —> ¿>i?, B b, A —» aA, 

A —» a, C^AB, C^A, C —» B 

Ejemplo 59 Sea /a gramática 

S —> aHb, H^aHb, H^e 

La única variable anulable es H. Y la gramática equivalente, que resulta de aplicar el algo¬ 
ritmo 2 es: 


S —> aHb , H —> aHb , 5 —> a¿>, // —>• a¿> 

4.2.3. Producciones Unitarias 

Las producciones unitarias son las que tienen la forma 

A B 


donde A, i? e V. 

Veamos como se puede transformar una gramática G, en la que £ ^ L(G), en otra gramática 
equivalente en la que no existen producciones unitarias. 

Para ello, hay que partir de una gramática sin producciones nulas. 

Entonces, se calcula el conjunto H de parejas ( A,B) tales que B se puede derivar a partir de 
A: A =>■ B. Eso se hace con el siguiente algoritmo 

\.H = % 

2. Para toda producción de la forma A —> B, 

la pareja (A, B) se introduce en H. 

3. Mientras H cambie 

4. Para cada dos parejas ( A,B ), (B,C) 

5. Si la pareja (A,C) no est en H 
(A,C) se introduce en H 

6. Se eliman las producciones unitarias 

7. Para cada producción A —► a 




100 


Modelos de Computación I 


8. Para cada pareja (B, A) e H 
9. Se añade una producción B —> a 

Ejemplo 60 Consideremos la gramática resultante en el ejemplo 58 del apartado anterior 

S^ABb, S^Ab, S —> Bb, S^ABC, S^AB, 

S —> AC, S->BC, S^A, S^B, S^C, 

C —■> abC, C —► a¿>, B —> bB, B —>• A —■> aA, 

A —> a, C—>AB, C —* A, C —> B 

El conjunto H est formado por las parejas {(5, A), (S,B), (S,C), (C,A), (C,B)}. 

Entonces se eliminan las producciones 

S^A, S^B, S -► C. C^A, C->B 
Se añaden a continuación las producciones (no se consideran las repetidas) 

S —* a, S —* e/A, S —>• ¿>B, S —>• S —► a¿>C, 

S —> C —■> e/A, C —> a, C —> ¿>B, C —> ¿> 

Ejemplo 61 £7 lenguaje L = {a n b n : n > 1} U {a n ba n : n > 1} viene generado por la siguiente 
gramática de tipo 2: 

S —* A, S —» B, A —>• a¿>, A —■> aHb 

H —■> // —> aHb, 5 —» aBa. B —> ¿> 

Las parejas resultantes en el conjunto H son {(S,A), (S,B)}. La gramática sin producciones 
unitarias equivalente es: 

A —> ab, A —> aHb, // —> // —> aHb, B —> e/Bn, 

B —> ¿>, S —* a¿>, S —> aHb, S —> aBn, S —> 
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4.3. Formas Normales 

4.3.1. Forma Normal de Chomsky 

Una gramática de tipo 2 se dice que est en forma normal de Chomsky si y solo si todas las 
producciones tienen la forma 


A —>• BC , A —> a, 

donde A,B,C eV,a eT. 

Toda gram ática de tipo 2 que no acepte la palabra vacía se puede poner en forma normal de 
Chomsky. Para ello lo primero que hay que hacer es suprimir las producciones nulas y unitarias. 
Acontinuación se puede ejecutar el siguiente algoritmo: 

1. Para cada producción de la forma A —> ai... a„, a, e (V U T),n > 2 

2. Para cada a, , si a, es terminal: a¿ — a eT 

3. Se añade la producción C a —> a 

4. Se cambia a¡ por C a en A —>• ai... a„ 

5. Para cada producción de la forma A —> . 61 ,... B m , m > 3 

6. Se añaden (m — 2) variables ...,2 (distintas para cada producción) 

7. La producción A—>B\... B m se reemplaza por 

A > B\D \, Di > B^Dii ■ ■ ■ i T) m —2 * ¡ B m 


Ejemplo 62 Sea /a Gramática G = ({S.A./L}. {a./?}./ J . S) dada por las producciones 

S —> bA | afi, A —■> ¿>AA ¡ AS | a, B —> aZÍZ? | bS \ b 

Para pasarla a forma normal de Chomsky, en el ciclo asociado al paso 1 se añaden las 
producciones 

C a * a, Cjy * 

y /ai anteriores se transforman en 

S —> C/ 7 A | C í( /L A —-» C/,AA | AS | C a , B —■> C a BB \ C¡,S \ C¡,h 
Al aplicar el paso asociado al paso 5, la gramática queda 

S —■» C\-,A | C/ 7 Z?, A —-> C¿,D] | AS | a, Dj —■> AA, 

B—>C a E\\C b S\b, Ei —> 5, C a —>a , Q, -> ¿> 

Con e.v/o /a gramática ya está en forma normal de Chomsky. 
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4.3.2. Forma Normal de Greibach 

Una gramática se dice que est en forma normal de Greibach si y solo si todas las produccio¬ 
nes tienen la forma 


A —> aa 

donde a G T, a G V*. Toda gramática de tipo 2 que no acepte la palabra vacía se puede poner 
en forma normal de Greibach. Para ello hay que partir de una gramática en forma normal de 
Chomsky y aplicarle el siguiente algoritmo. En realidad no es necesario que la gramática esté en 
forma normal de Chomsky. Basta que todas las producciones sean de uno de los tipos siguientes: 

-A—►acc, aeT,aeV*. 

- A—>-a, aeV*. 

Claro está, en una gramática en forma normal de Chomsky, todas las producciones son de 
alguno de estos dos tipos. 

En este algoritmo se supone que el conjunto de variables de la gramática está numerado: 
V = {A i,, A m j-. 

El algoritmo se basa en dos operaciones básicas. La primera es eliminar una producción, 
A —> Ba de la gramática G, donde A^B. Esto se hace con los siguientes pasos: 

1. Eliminar A —► Ba 

2. Para cada producción B —► p 

3. Añadir A —> pa 


La idea básica de esta operación es la siguiente. Si aplicamos A —> Ba, entonces, después 
tenemos que realizar una sustitución de B, mediante una producción B —> p. Uniendo las dos 
sustituciones, obtenemos A =>■ Ba =>- Pa. Es decir, A se puede sustituir por Pa. Si eliminamos 
A —> Ba, esta sustitución ya no se puede hacer, por lo que si no queremos perder la posibilidad 
de eliminar ninguna palabra después de esta eliminación, tenemos que añadir producciones que 
nos permitan hacer esta sustitución. Por ese motivo añadimos A —> pa, que permite realizar los 
dos pasos de antes en uno sólo. 

La otra operación básica consiste en eliminar todas las producciones del tipo A —> Aa donde 
a G V*. Esto se hace siguiendo los siguiente pasos: 

1. Añadir una nueva variable B,\ 

2. Para cada producción A —► Aa 

3. Añadir Ba —> ay Ba —> a Ba 
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4. Eliminar A —> Aa 

5. Para cada producción A —^ |3 p no empieza pro A 

6. Añadir A —> p/G 

Llamemos ELIMINABA —> Bu) a la función que reliza el primer paso y ELIMINAoíA) a la 
función que reliza el segundo paso. Si si llama a ELIMINA9(Aj), la variable que añadimos la 
notaremos como B¡. 

En estas condiciones vamos a realizar un algoritmo, al final del cual todas las producciones 
tengan una forma que corresponda a alguno de los patrones siguientes: 

- A —> r/oc, ci £ L, OC £ V*. 

- A¡ Aja, j>i,ueV*. 

- Bj —>• Ai a, a £ V* 

El algoritmo es como sigue: 

1. Para cada k— 1,..., m 

2. Para cada j — 

3. Para cada producción A^- —> AjU 

4. ELIMINA|(A /t - ->• Aja) 

5. Si existe alguna producción de la forma A/, —> A^a 

6. ELIMINA 2 (AG 


A continuación se puede eliminar definitivamente la recursividad por la izquierda con el 
siguiente algoritmo pasando a forma normal de Greibach 


1. Para cada i = m — 1,..., 1 

2. Para cada producción de la forma A, —> A v a. j > i 

3. ELIMINABA, ->• Aja) 

4. Para cada i — 1,2,..., m 

5. Para cada producción de la forma Bj —> A¡u. 

6. ELIMINAfifíj —>A,a) 


El resultado del segundo algoritmo es ya una gramática en forma 
normal de Greibach. 
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Ejemplo 63 Pasar a forma normal de Greibach la gramática dada por las producciones 

A\ * A2A3, A 2 * A3A1, A2^b, A 3 ■> A1A2, A3 —> a 

Aplicamos ELIMINA \ a A 3 —> A \Aj. 

Se elimina esta producción y se añade: A3 —>• A2A3A2 
Queda: 

Ai—>A2A3, A 2 > A 3 A 1 , A2^b, 

A3 —> a, A3 —► A2A3A2 


Aplicamos ELIMINA\ a A 3 —»A2A3A2 

5 c elimina esta producción y se añaden: A3 —> A3A1A3A2, A3 M3A2 
Queda: 


Al —>A 2 A 3 , A2 —>A 3 Ai, A2 — 

A3 —> a, A3 —» A3A1A3A2, A3 —> ¿A3A2 
Aplicamos ELIMINA2 a A3 

5 c añade £>3 y /c/s producciones B3 —■> A1A3A2, i?3 —> A1A3A2.63 
Se elimina A3 —► A3A1A3A2. 

5 c añaden las producciones: A3 —> 083, A3 —>• M3A283 
Queda: 


Ai > A2A3, A2 —^A3 Ai, A2—>b, A3 —> a, 

A3 —* M3A2 63 —^ AV1A3A2, 83 —► A1A3A2B3 A3 —> «83, 

A3 —>• M3A283 

5 c aplica ELIMINA \ a A2 —> A3A1. 

5 c elimina esta producción y se añaden: 

A2 —> C/Ai, A2 —> C1B3A1, A2 —> ¿A3A283A1, A2 —» ¿A3A2A1 

Queda: 


Ai ^A2A3, A2 —> A2 —>aAi, A2 —>• Í163A1, 

A2 —> ¿A3A283A1, A2 —> M3A2A1, A3 —* a, A3 —> M3A2, 

83 —^ AV1A3A2, 83 —>■ A1A3A2B3 A3 —* C/83, A3 —>• ¿A3A2.B3 

5 c aplica EL 1 MINA\ a A\ —> A2A3. 

5 c elimina esta producción y se añaden: 
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Ai —> M3, Ai —»• ÍÍA1A3, Ai —> aB^AiA?,, 
Ai —■> M3A263A1A3, Ai —■> M3A2A1A3 

Queda: 


A 2 —* A 2 —» aAi A 2 —* üB^Ai, 

A 2 —> M 3 A 2 .B 3 A 1 , A 2 ► ¿A 3 A 2 A 1 , A 3 —>• a, 

A3 —» M3A2, 63 ^ A1A3A2, 63 —> A1A3A2.B3, 

A3 —>• «63, A3 —■> ¿A3A263, Ai —>• M3, 

Ai —* aAiA3, Ai —■> aB?,A\A3, Ai —>• ¿A3A263A1A3, 

Ai —>• M 3 A 2 A 1 A 3 

5c aplica ELIM1NA\ a B 3 —> A 1 A 3 A 2 5c elimina esta producción y se añaden: 


B 3 —» M3A3A2, 63 — 5 ► «A1A3A3A2, 63 —>• ÍÍÜ3A1A3A3A2, 

£3 —>• M3A2ÍI3A1A3A3A2, 63 —> aB?,AiA 3 AT,A 2 , 

Queda: 


A 2 —> ¿>, A 2 —> aAi A 2 —> aB-^A \ , 

A 2 —>• M 3 A 2 6 3 A 1 , A 2 —> M 3 A 2 A 1 A 3 —■> a, 

A 3 —■» M 3 A 2 , 63 —i- A 1 A 3 A 2 . 63 , A 3 —»• < 7 . 63 , 

A3 » ¿A3A263, Ai—>¿>A3, Ai —> aA\Ai, 

Ai —>• ÍÍ 53 A 1 A 3 , Ai —» M 3 A 2 . 63 A 1 A 3 , Ai —>• M 3 A 2 A 1 A 3 

£3 —> ¿A3A3A2, 63 —> «A1A3A3A2, 63 —> Í753A1A3A3A2, 

£3 —> ¿A 3 A 263 A 1 A 3 A 3 A 2 , 63 —» aB 2 ,AiA 2 ,Ai,A 2 , 

Se aplica ELIMINA\ a B 3 —> A 1 A 3 A 263 . 5c elimina esta producción y ,vc añaden: 

B3 —» ¿A3A3A263, 63 —> C/A1A3A3A253, 53 —» ci.63A1A3A3A2.63, 

i ?3 —» M 3 A 263 A 1 A 3 A 3 A 263 , ^3 —► Í/ 63 A 1 A 3 A 3 A 263 ; 

Resultado: 


A 2 —> b, 

A2 —> M3A263A1, 

A3 —> M3A2, 

Ai —> M3, 

Ai —> ¿A 3 A 263 A 1 A 3 , 

S 3 —> C/A 1 A 3 A 3 A 2 , 

^3 —■> C/Ü 3 A 1 A 3 A 3 A 2 , 

^3 —> tf.63A1A3A3A2.63, 


A 2 —> tfAi, 

A 2 —i► ¿A 3 A 2 A 1 

A3 —> c/63, 

Ai —» C/A 1 A 3 , 

Ai —■> M 3 A 2 A 1 A 3 , 

63 —» C/63A1A3A3A2, 

63 —> M3A3A263, 

63 —> M3A263A1A3A3A263, 


A 2 —> C/ 63 A 1 , 

A 3 —> tf, 

A3 —» M3A263, 

Ai —» C/63A1A3, 

63 —■> M3A3A2, 

63 —» M3A263A1A3A3A2, 
63 —> C/A1A3A3A263, 

63 —> C/63A1A3A3A263 
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5.1. Definición de Autómata con Pila 

Los lenguajes generados por las gramáticas libres de contexto también tienen un autómata 
asociado que es capaz de reconocerlos. Estos autómatas son parecidos a los autómatas fini¬ 
tos determinísticos, solo que ahora tendrán un dispositivo de memoria de capacidad ilimitada: 
una pila. A contincuación daremos la definición formal de autómata con pila no determinístico 
(APND). Al contrario que en los autómatas finitos, los autómatas con pila no detrminísticos y 
determinísticos no aceptan las mismas familias de lenguajes. Precisamente son los no determís- 
ticos los asociados con los lenguajes libres de contexto. Los determinísticos aceptan una familia 
mas restringida de lenguajes. 

Definición 43 Un autómata con pila no determinístico (APND) es una séptupla (Q.A.B. 8. qo,Zo, F) 
en la que 

- Q es un conjunto finito de estados 

- A es un alfabeto de entrada 

- B es un alfabeto para la pila 

- 8 es la función de transición 

8 : 2 x (Au{e}) xB —>• p(<2 xB*) 


- qo es el estado inicicd 

- Zq es el símbolo inicicd de la pila 


- F es el conjunto de estados finales 


La función de transición aplica cada estado, cada símbolo de entrada (incluyendo la cadena 
vacía) y cada símbolo tope de la pila en un conjunto de posibles movimientos. Cada movimiento 
parte de un estado, un símbolo de la cinta de entrada y un símbolo tope de la pila. El movimento 
en sí consiste en un cambio de estado, en la lectura del símbolo de entrada y en la subtitución 
del símbolo tope de la pila por una cadena de símbolos. 


Ejemplo 64 Sea el autómata M = ({<71,<72}, { 0 , l,c},{i?,5,G},8,9i,i?,0) donde 


6 (q h 0 ,R) = {(q h BR)} 
8 ( qi , 0 ,B) = {( qi ,BB)} 
8 (<? 1 , 0 ,G) = {(qi : BG)} 
8 {q h c,R) = {( 92 , 5 )} 
8(91 ,c,G) = {(q2,G)} 
8(92,1 ,G) = {(<72,e)} 


8(91, 1 , 5 ) = {(qi,GR)} 
8 (q h l,B) = {(q h GB)} 
b(q h l,G) = {(q h GG)} 
5 (q\,c,B) = {{qi,B)} 
8 ( 92 , 0 , 5 ) = {(92, e)} 
8(92, e, R) = {(92, e)} 
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La interpretación es que si el autómata est en el estado q\ y lee un 0 entonces permanece 
en el mismo estado y añade una B a la pila; si lo que lee es un 1, entonces añade una G; si lee 
una c pasa a q 2 . En q 2 se saca una B por cada 0, y una G por cada 1. 

Se llama descripción instantá nea o configuración de un autómata con pila a una tripleta 

(q,u,a) eQxA* xB* 

en la que q es el estado en el se encuentra el autómata, u es la parte de la cadena de entrada que 
queda por leer y a el contenido de la pila (el primer símbolo es el tope de la pila). 

Definición 44 Se dice que de la configuración (q.au.Za) se puede llegar a la configuración 
(p, «, (3a) y se escribe (q , au, Za) b (p, u, (3a) si y solo si 

(p,(3) G 8 ( 4 ,a,Z) 

donde a puede ser cucdquier símbolo de entrada o la cadena vacía. 

Definición 45 Si C\ y C 2 son dos configuraciones, se dice que se puede llegar de C\ a C 2 me- 

* 

diante una sucesión de pasos de cá leulo y se escribe C\ b C 2 si y solo si exite una sucesión de 
configuraciones T\.....T n tales que 

Ci = 7j b T b T n -i b T n = C 2 

Definición 46 Si M es un APND y uE A*, se llama configuración inicicd correspondiente a esta 
entrada, u, a (qo.u.Zo) donde qo es el estado inicial y Zq el símbolo inicial de la pila. 

Ejemplo 65 En el caso del autómata con pila del ejemplo anterior tenemos 

(<7i,011cll0,i?) b (qi, llcllO,Z?/?) b (q h lcllO,GBR) b {q u cllO,GGBR) b 

{q 2 ,U0,GGBR) b (q 2 , 10 ,GBR) b (q 2 ,0,BR) b (q 2 ,B,R) b {q 2 ,Z,z) 


5.1.1. Lenguaje aceptado por un autómata con pila 

Existen dos criterios para determinar el lenguaje aceptado por un APND: 
a) Lenguaje aceptado por estados finales: 

E(M) — {w eA* : (q 0 ,w,z 0 ) b (p,£,y),p E F,y e B*} 
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b) Lenguaje aceptado por pila vacía: 

N(M) = {w e A*: (qo,w,Z Q ) h (p,e,e),p e Q} 


En el primer caso, una palabra es aceptada, si se puede llegar a un estado final después de 
consumir la entrada. En el segundo criterio, los estados finales no tienen ningún significado, y 
una palabra se acepta si cuando se termina de leer la entrada la pila se queda vacía. 


Ejemplo 66 En el caso del ejemplo 64, la palabra 01 lcl 10 es aceptada por el autómata por el 
criterio de pila de vacía. Es decir, 01 lcl 10 G N(M). De hecho, el lenguaje aceptado por el este 
autómata, según el criterio de la pila vacía es N(M) = {wcw : w € {0,1}*}. Para este mismo 
autómata L(M ) = 0, ya que al no haber estados finales, nunca se puede verificar la condición de 
aceptación. Una pequeña modificación del APND, lo tranformaría en una autómata que acep¬ 
tase el mismo lenguaje, pero ahora por el criterio de estados finches. Solo hay que considerar 
M = ({<7i,<72,<73}, {0, l,c}, {5,5,G}, 8 , 91 ,/?, {< 73 }) donde 


5 (q h 0 ,R) = {(qi,BR)} 
&(q h 0,B) = {(qi,BB)} 
8(q h 0,G) = {(q h BG)} 
8(91 ,c,R) = {(92,5)} 
8(qi,c,G) = {(q 2 ,G )} 
8(92,1 ,G) = {( 92 ,e)} 


8(9 1 ,l,i?) = {(9 1 ,G^)} 
8 ( 9 !, 1,5) = {( 9 !, GB)} 
8(9!,l,G) = {(9i,GG)} 
8(9 i, c, B) = {(92,5)} 
8(92,0,5) = {(92, e)} 
8(92, e, R) = {( 93 , 5 )} 


Teorema 15 a) Si M es un APND entonces existe otro autómata M', tal que N(M ) = L(M') 
b) Si M es un APND entonces existe otro autómata M', tal que L(M) = N(M'). 


Demostración. - 

a) Si M — ( Q,A , B , 8, qo,Zo,F), entonces el autómata M' se construye a partir de M siguiendo 
los siguientes pasos: 

- Se añaden dos estados nuevos, q' Q y qy. El estado inicial de M' será q' 0 y qp será 
estado final de M'. 

- Se añade un nuevo símbolo a B: Z' Q . Este será el nuevo símbolo inicial de la pila. 

- Se mantienen todas las transiciones de M. añadiéndose las siguientes: 

O 8(9q,8,Zq) = {(9o,Z 0 Zq)} 

8(9,e,Z') = {(9 / ,^)}, \/qeQ 


O 
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b) Si M = ( Q,A , B, 8 , qo,Zo,F), entonces el autómata M' se construye a partir de M siguiendo 
los siguientes pasos: 

- Se añaden dos estados nuevos, q' 0 y q s . El estado incial de M' será q' {) . 

- Se añade un nuevo símbolo a B: Z' Q . Este será el nuevo símbolo inicial de la pila. 

- Se mantienen todas las transiciones de M, añadiéndose las siguientes: 

O 8(<7Ó,£,Zq) = {(<7o,Z 0 Zc))} 

o S(q,e,H) = {(q s ,H)} : \/q E F,H G BU{Z' 0 } 

O S(q s ,e,H) = {(q s ,e)}, VHEBU{Z' Q } 


5.2. Autómatas con Pila y Lenguajes Libres de Contexto 

Teorema 16 Si un lenguaje es generado por una gramática libre del contexto, entonces es acep¬ 
tado por un Autómata con Pila No-Determinístico. 

Demostración. - Supongamos que la gramática no acepta la palabra vacía. En caso de que acepte 
la palabra vacía se le eliminaría y después se podría transformar el autómata para añadir la 
palabra vacía al lenguaje aceptado por el autómata. 

Transformemos entonces la gramática a forma normal de Greibach. El autómata con pila 
correspondiente es M — ({<?}, T, V , 8, q, S, 0) donde la función de transición viene dada por 

(q,y) G 8{q,a,A ) -^A—^ayeP 

Este autómata acepta por pila vacía el mismo lenguaje que genera la gramática. ■ 


Ejemplo 67 Para la gramática en forma normal de Greibach: 

S —> aAA 


el autómata es 


A —> aS I bS I a 


M = ({?}, {a,b}, {A,S}, b,q,S, 0) 


donde 


8{q,a,S) = {{q,AA)} 
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8(?,M) = {(?,S),($,e)} 

5(9, M) = {(9,5)} 

Teorema 17 Si L = N(M) donde M es un APND, existe una gramática libre del contexto G, tal 
que L(G ) = L. 

Demostración. - 

Sea M — ( Q,A,B,b,qo,Zo,(d ), tal que L = N(M). La gramática G = ( V,A,P,S ) se construye 
de la siguiente forma: 

- V será el conjunto de los objetos de la forma [q,C,p\, donde p,q G Qy C G B, además de 
la variable S que será la variable inicial. 

- P será el conjunto de las producciones de la forma 

1. S —> [qo,Z,q] para cada q e Q. 

2 . [q,C,q m \ > &[PiD\ ,< 71][<71 : D2 1 qi\ ■ ■ • Idm— 1 ? qm\ 
donde a G A U£, y C,Di,.. .,D m e i? tales que 

(p,DiD 2 ...D m ) G 8{q,a,C) 

(si m = 0 , entonces la producción es [^,A,p] —> a). 

Esta gramática genera precisamente el lenguaje N(M). La idea de la demostración es que la 
generación de una palabra en esta gramática simula el funcionamiento del autómata no deter- 
minístico. En particular, se verificar que [q,C,p] generar la palabra .r si y solo si el autómata 
partiendo del estado q y llegando al estado p, puede leer la palabra v eliminando el símbolo C 
de la pila. ■ 


Ejemplo 68 Si partimos del autómata M = ({<7o -di}- {0,1}, {A.Z},8.í/o.Zo.0j, donde 

Steo, 0,Z 0 ) = {(< 7 o,XZ 0 )}, 8 ( 9 t, l,X) = {(9!,e)} 

5(90, 0 ,X) = {( 90 , XX)}, 5 ( 91 , 8 , X) = {( 9 i,e)} 

5 ((?o, l,X) = {(91,e)}, 6(91, 8 , Z 0 ) = {(91,e)} 


las producciones de la gramática asociada son 
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S —> [qo,Zo,qo] 
s —> [qo,Z 0 ,qi] 

[qo,Zo,qo\ 0 [qo,X,qo\[qo,Zo,qo] 

[qo,Z().q\] ^ 0 [qo,X,qo][qo,Zo,qi] 

[qo,Zo,qo\ ^ 0 [qo,X,qi][qi,Zo,qo] 

[qo,Zo,qi\ ^ 0 [qo,X,qi][qi,Zo,qi] 

[< 7 o,^,< 7 o] ~^ 0 [qo,X,qo][qo,X,qo] 

[qo,X,qi] -^ 0 [qo,X,qo\[qo,X,qi] 

[< 70 ,X,< 7 o] -^ 0 [qo,X,qi][qi,X,qo] 

[q 0 ,X,qi] -> 0 [qQ,X,q{\[qi,X,q{\ 

[qo,X,qi] -»• i 
[qi,X,qi] -> i 
[í/i,x,(/ii ■» £ 

[< 7 l, -Zo, <?l] —► £ 

Elimando símbolos y producciones inútiles queda 

S —> [< 7 o, -Zo, < 7 t] 

[cyo,Z().( 7 i] —> 0[<7o,^,<?i][(/i,-Zo,<?i] 

[í7o,A,(/i] —> 0[^o,-X’,^t][íi)-X’)íi] 

[q\,X,qi] -*• 1 
[í7l,X,(/iÍ ■> £ 

[<7l,Zo,<?i] —> £ 

Después de esta equivalencia un lenguaje independiente del contexto puede definirse indis¬ 
tintamente como aquel que es generado por una gramática de tipo 2 o bien como aquel que es 
aceptado por un autómata con pila. 

5.3. Lenguajes Independientes del Contexto Deterministas 

Definición 47 Un autómata con pila se dice que es determinista (APD) si y solo si se verifican 
las dos condiciones siguientes 

1 . \/q E Q, Z <E B, si 8(q,£,Z) 0 entonces 8(q,a,Z) = 0, VaeA. 

2 . Va G A U £, z G B, q G F, 8(q, a,Z) nunca contiene más de un elemento. 
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El autómata del Ejemplo 64 es un autómata determinista. 

La clase de lenguajes aceptados por un autómata con pila determinista es más reducida que 
la clase de los lenguajes aceptados por los autómatas con pila genéricos. Además, en el caso 
de los autómatas con pila deterministas, los dos criterios (pila vacía y estados finales) no son 
equivalentes. 

Definición 48 Un lenguaje L se dice que es independiente del contextos determinista si y 

solo si es aceptado por un autómata con pila determinista por el criterio de estados finales. 

Ejemplo 69 El lenguaje aceptado por el autómata del Ejemplo 64 era L — { wcw 1 : w e {(). 1 }*}. 
El autómata era determinista, pero el criterio usado era el de estados finales. Sin embargo, el 
autómata se puede convertir en otro también determinista y que acepte E por el criterio de 
estados finales. 

Sea el autómata M = ({< 71 ,< 72 }; {0, 1 , c}, {R,B, G},8,qi,R : {< 73 }) donde 

5 (<7t,0, R) = {(q h BR)} 8 ( 91 , 1 ,R) = {( q U GR )} 

8 (< 7 t, 0 ,B) = {( q h BB )} 5 (q h 1 ,B) = {(q u GB)} 

5(91,0, G) = {(qi,BG)} 5 (q h 1 ,G) = {(qi,GG)} 

8{q h c,R) = {( 92 ,/?)} 6(qi,c,B) = {( q 2 ,B )} 

8 ( 91 , c,G) = {((72, G)} 8 (^ 2 , 0 , 5 ) = {((72, e)} 

8(92 ,1 ,G) = {((72, e)} 8 (®, e,/?) = {(93, e)} 

El autómata tiene un sólo estado final y lo que hemos hecho es que, al mismo tiempo que 
dejamos la pila vacía, pasamos a ese estado final. 

Lo que hemos hecho en el ejemplo anterior es siempre posible y se puede demostrar el 
siguiente resultado. 

Teorema 18 Si E es aceptado por un autómata con pila determinista M por el criterio de pila 
vacía, entonces existe otro autómata con pila determinista M' que acepta el mismo lenguaje por 
el criterio de estados finales. 

Demostración. - La demostración es la misma que la del apartado a) del Teorema 15. Sólo hay 
que tener en cuenta que en la transformación que se realiza, si partimos de un autómata con pila 
determinista M , entonces el autómata con pila que se obtiene, M' es también determinista. ■ 

El resultado inverso no es cierto. Hay lenguajes que son aceptados por autómatas con pila 
por el criterio de estados finales, que no pueden ser aceptados por el criterio de pila vacía. 
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Ejemplo 70 El siguiente autómata determinista acepta por el criterio de estados finales el len¬ 
guaje de las palabras del lenguaje sobre { 0 , 1 } con la misma cantidad de ceros que de unos, 
donde 92 es el estado final y R el símbolo inicial de la pila. 

5(<7t,0,X) = {( 9 i,XX)} 5(9i, 1,F) = {( 9 t, YY)} 

5 ( 9 i,1,X) = {( 91 ,e)} 5 ( 9 i, 0 ,y) = {( 91 ,e)} 

5(9i,e, R) = {( 92 ,^)} 5(92,0,i?) - {( 9 i,X/?)} 

5(92,1,/?) -{(91, YR)} 

Sin embargo, no puede ser aceptado por un autómata determinista por el criterio de pila 
vacía. El problema es el siguiente: si fuese posible, después de leer 0011 se quedaría la pila 
vacía, pero entonces la palabra formada por 001101 no podría ser aceptada, porque cd ser el 
autómata determinista, después de leer la primera parte de la parte, 0011, la pila se quedaría 
vacía y como un autómata no puede seguir funcionando con la pila vacía, la palabra completa 
001101 no podría ser leída y, por tanto no es aceptada. 

El razonamiento del ejemplo anterior se puede generalizar a cualquier lenguaje en el que se 
de la misma situación: dos palabras u y v del lenguaje distintas tal que una es un prefijo de la 
otra (una subcadena del principio de la palabra). De hecho esta propiedad es fundamental para 
caracterizar a los lenguajes aceptados por un autómata con pila deterministas por el criterio de 
estados finales que lo son también por el criterio de pila vacía. En lo que sigue, formalizamos lo 
que que acabamos de decir. 

Definición 49 Un lenguaje L se dice que tiene la propiedad prefijo si no existen dos palabras 
u. y G L tales que u f v y una es un prefijo de la otra. 

El siguiente teorema (que enunciamos sin demostración) establece la relación entre los dos 
criterios de aceptación en autómatas con pila deterministas. 

Teorema 19 Un lenguaje L puede ser acepatado por un autómata con pila determinista por el 
criterio de pila vacía si y solo si puede ser aceptado por un autómata con pila determinista por 
el criterio de estados finales y tiene la propiedad prefijo. 

Si tenemos un lenguaje, L, independiente del contexto determinista que no cumple la propie¬ 
dad prefijo es fácil tranformarlo en otro lenguaje muy similar que cumple la propiedad prefijo y 
puede ser aceptado por un autómata con pila determinista por el criterio de pila vacía. Basta con 
considerar un símbolo $ f L y entonces el lenguaje viene dado por 

L{$} = {«$ : u E L} 

Es como añadirle un símbolo de fin de palabra ($) a todas las palabras de L. 
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Finalmente, es importante que quede claro que hay lenguajes que son independientes del 
contexto,pero no deterministas. Como ejemplo,podemos considerar L— {u G {0,1}* : u = w” 1 }. 
No vamos a demostrar formalmente que este lenguaje no es deterministas. Intuitivamente, las 
palabras de este lenguaje se reconocen metiendo símbolos en la pila hasta la mitad de la palabra 
(primera fase), y después de la mitad se sacan símbolos de la pila (segunda fase). Si aparece 
el símbolo inicial de la pila se pasa a un estado final y la palabra es aceptada. El problema es 
que cuando se está leyendo la palabra símbolo a símbolo no se sabe cuando estamos en la mitad 
de la palabra y cuando hay que pasar de meter símbolos a sacar. Si perminitimos que haya no 
determinismo esto se resuelve dando, en todo momento de la primera fase, la opción de cambiar 
de la primera a la segunda fase. 
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6.1. Lema de Bombeo 

Comenzamos esta sección con un lema que nos da una condición necesaria que deben de 
cumplir todos los lenguajes libres de contexto. Nos sirve para demostrar que un lenguaje dado 
no es libre de contexto, comprobando que no cumple esta condición necesaria. 

Lema 2 (Lema de Bombeo para lenguajes libres de contexto) Sea L un lenguaje libre de 
contexto. Entonces, existe una constante n, que depende solo de L, tal que si z<E L y z >n,zse 
puede escribir de la forma z = uvwxy de forma que 

1 . M > 1 

2 . \vwx\ < n, y 

3. Vi > 0 , uv'wx'y e L 

Demostración. - 

Sólo vamos a indicar una idea de cómo es la demostración. Supongamos que la gramática 
no tiene producciones nulas ni unitarias (si existieses siempre se podrían eliminar). 

Supongamos un árbol de derivación de una palabra u generada por la gramática. Es fácil 
ver que si la longitud de u es suficientemente grande, en su árbol de derivación debe de existir 
un camino de longitud mayor que el número de variables. Sea N un número que garantice que 
se verifica esta propiedad. En dicho camino, al menos debe de haber una variable repetida. 
Supongamos que esta variable es A, y que la figura 6.1 representa el árbol de derivación y dos 
apariciones consecutivas de A. 


Ejemplo 71 Vamos a utilizar el lema de bombeo para probar que el lenguaje L — {a'b l c l \ i > 1 } 
no es libre de contexto. 

Supongamos que L fuese libre de contexto y sea n la constante especificada en el Lema 
de Bombeo. Consideremos la palabra z — a n b n c n G L, que tiene una longitud mayor que n. 
Consideremos que z se puede descomponer de la forma z — uvxy, verificando las condiciones 
del lema de bombeo. 

Como \vwx\ < n, no es posible para vx tener símbolos ay c al mismo tiempo: entre la última 
a y la primera c hay n símbolos. En estas condiciones se pueden dar los siguientes casos: 

- va' contiene solamente símbolos a. En este caso para i = 0, uv°wx°y — uwy debería 
de pertenecer a L por el lema de bombeo. Pero uwy contiene n símbolos b, n símbolos c, 
menos de n símbolos a, con lo que no podría pertenecer aLy se obtiene una contradicción. 
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S 



Figura 6.1: Arbol de Derivación en el Lema de Bombeo 

- |vjc| contiene solamente símbolos b. Se llega a una contradicción por un procedimiento 
similar cd anterior. 

- \vx\ contiene solamente símbolos c. Se llega a una contradicción por un procedimiento 
similar. 

- \vx\ contiene símbolos ay b. En este caso, uwy tendría más símbolos c que a o b, con lo 
que se llegaría de nuevo a una contradicción. 

- \vx\ contiene símbolos b y c. En este caso, uwy tendría más símbolos a que b o c, con lo 
que se llegaría también a una contradicción. 

En todo caso se llega a una contradicción y el lema de bombeo no puede cumplirse, con lo 
que L no puede ser libre de contexto. 

Es importante señalar que el lema de bombeo no es una condición suficiente. Es solo nece¬ 
saria. Así si un lenguaje verifica la condición del lema de bombeo no podemos garantizar que 
sea libre de contexto. Un ejemplo de uno de estos lenguajes es 

L = {a i b j c k d l \{i = 0 )\j{j = k = l)} 

Ejemplo 72 Demostrar que el lenguaje L = { a'b^c'd J : i. j > 0} no es libre de contexto. 
Ejemplo 73 Demostrar que el lenguaje L = {a l bh: k : i > j > k > 0} no es libre de contexto. 
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6.2. Propiedades de Clausura de los Lenguajes Libres de Con¬ 
texto 

Teorema 20 Los lengaujes libres de contexto son cerrados para las operaciones: 

- Unión 

- Concatenación 

- Clausura 

Demostración. - 

Sean G\ = (Vi, T\,P\,S\) y G 2 — (V 2 , 72 ,^ 2 ,S 2 ) dos gramáticas libres de contexto y L\ y L 2 
los lenguajes que generan. Supongamos que los conjuntos de variables son disjuntos. Demos¬ 
traremos que los lenguajes L\ UL 2 , L 1 Li y Lj son libres de contexto, encontrando gramáticas de 
tipo 2 que los generen. 

■ L\ U Lo. Una gramática que genera este lenguaje es G 3 = (Vi U V? U {S 3 }. 7j 

donde S 3 es una nueva variable, y P 3 = P\ UP 2 más las producciones S 3 —> Si y S 3 —> SS- 

■ L1L2 . Una gramática que genera este lenguaje es G4 = (Vi U V2 U {S4}, T \ U To . Pa . S / í ), 
donde S 4 es una nueva variable, y P 4 = P\ UP 2 más la producción S 4 —* S\S 2 - 

■ L\. Una gramática que genera este lenguaje es G¡ = (Vi U {S5}, Ti,Ps,Ss), donde P¡ es P\ 
más las producciones S 5 —> S 1 S 5 y S¡ —> £. 


Algunas propiedades de clausura de los lenguajes regulares no se verifican en la clase de los 
lenguajes libres de contexto, como las que expresan el siguiente teorema y corolario. 

Teorema 21 La clase de los lenguajes libres de contexto no es cerrada para la intersección. 

Demostración.- Sabemos que el lenguaje L — {a'b l c' \i> 1} no es libre de contexto. Por otra parte 
los lenguajes L 2 = {a l b l c^\i > 1 y y’>l}yL 3 = {a l b^c^ l¿ > 1 y./ > 1} si lo son. El primero de 
ellos es generado por la gramática: 

S —> AB 
A —> aAb\ab 
B —> cB\c 
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y el segundo, por la gramática: 

S —> CD 
C —> aC\a 
D —> bDc\bc 

Como Li nZ .3 = L\, se deduce que la clase de lenguajes libres de contexto no es cerrada para 
la intersección. 


Corolario 1 La clase de lenguajes libres de contexto no es cerrada para el complementario. 
Demostración. - 

Es inmediato, ya que como la clase es cerrada para la unión, si lo fuese para el complemen¬ 
tario, se podría demostrar, usando las leyes DeMorgan que lo es también para la intersección. 


6.3. Algoritmos de Decisión para los Lenguajes Libres de Con¬ 
texto 

Existen una serie de problemas interesantes que se pueden resolver en la clase de los lengua¬ 
jes libres de contexto. Por ejemplo, existen algoritmos que nos dicen si un Lenguaje Libre de 
Contexto (dado por una gramática de tipo 2 o un autómata con pila no determinístico) es vacío, 
finito o infinito. Sin embargo, en la clase de lenguajes libres de contexto comienzan a apare¬ 
cer algunas propiedades indecidibles. A continuación, veremos algoritmos para las propiedades 
decidióles y mencionaremos algunas propiedades indecidibles importantes. 

Teorema 22 Existen algoritmos para determinar si un lenguaje libre de contexto es 

a) vacío 

b) finito 

c) infinito 


Demostración. - 
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a) De hecho, ya hemos visto un algoritmo para determinar si el lenguaje generado por una 
gramática de tipo 2 es vacío. En el la primera parte del algoritmo para eliminar símbolos y 
producciones inútiles de una gramática, se determinaban las variables que podían generar 
una cadena fromada exclusivamente por símbolos terminales. El lenguaje generado es 
vacío si y solo si la variable inicial S es eliminada: no puede generar una palabra de 
símbolos terminales. 

b) y c) Para determinar si el lenguaje generado por una gramática de tipo 2 es finito o infinito 
pasamos la gramática a forma normal de Chomsky, sin símbolos ni producciones inútiles. 
En estas condiciones todas las producciones son de la forma: 

A —>• BC , A —► a 

Se construye entonces un grafo dirigido en el que los vértices son las variables y en el 
que para cada producción de la forma A —> BC se consideran dos arcos: uno de A a B y 
otro de A a C. Se puede comprobar que el lenguaje generado es finito si y solo si el grafo 
construido de esta forma no tiene ciclos dirigidos. 


Ejemplo 74 Consideremos la gramática con producciones, 

S-+AB 
A —■> BC\a 
B -> CC\b 
C —* a 

El grafo asociado es el de la figura 6.2. No tiene ciclos y el lenguaje es finito. Si añadimos 
la producción C —> AB, el grafo tiene ciclos (figura 6.3) y el lenguaje generado es infinito. 


6.3.1. Algoritmos de Pertenencia 

Estos algoritmos tratan de resolver el siguiente problema: dada una gramática de tipo 2, 
G = (V, T, P. S) y una palabra u e T*, determinar si la palabra puede ser generada por la gramá¬ 
tica. Esta propiedad es indecidible en la clase de lenguajes recursivamente enumerables, pero es 
posible encontrar algoritmos para la clase de lenguajes libres de contexto. 
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Figura 6.2: grafo asociado a una gramática de tipo 2 con lenguaje finito 



—*(a) 




Figura 6.3: grafo asociado a una gramática de tipo 2 con lenguaje infinito 


Un algoritmo simple, pero ineficiente se aplica a gramáticas en forma normal de Greibach 
(si una gramática no está en esta forma se pasa, teniendo en cuenta que hemos podido dejar 
de aceptar la palabra vacía). La pertencencia de una palabra no vacía se puede comprobar en 
esta forma normal de Greibach de la siguiente forma: Como cada producción añade un símbolo 
terminal a la palabra generada, sabemos que una palabra, u, de longitud \u\ ha de generarse 
en \u\ pasos. El algoritmo consistiría en enumerar todas las generaciones por la izquierda de 
longitud |w|, tales que los símbolos que se vayan generando coincidan con los de la palabra u, y 
comprobar si alguna de ellas llega a generar la palabra u en su totalidad. Este algoritmo para, ya 
que el número de derivaciones por la izquierda de una longitud dada es finito. Sin embargo puede 
ser muy ineficiente ( exponencial en la longitud de la palabra). Para comprobar la pertenencia 
de la palabra vacía se puede seguir el siguiente procedimiento: 

- Si no hay producciones nulas, la palabra vacía no pertence. 

- Si hay producciones nulas, la palabra vacía pertenece si y solo si al aplicar el algoritmo 
que elimina las producciones nulas, en algún momento hay qhe eliminar la producción 
S —> £. 

El Algoritmo de Cocke-Younger-Kasami 

Existen algoritmos de pertenencia con una complejidad G(n 3 ), donde n es la longitud de 
la palabra de la que se quiere comprobar la pertenencia. Nosotros vamos a ver el algoritmo 
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de Cocke-Younger-Kasami (CYK). Este algoritmo se aplica a palabras en forma normal de 
Chomsky. Este consta de los siguientes pasos (n es la longitud de la palabra). 

1. Para i — 1 hasta n 

2. Calcular V¡\ — {A \ A —> a es una producción y el simbolo i-esimo de u es a} 

3. Para j — 2 hasta n 

4. Para i = 1 hasta n — j + 1 

5. Víj 0 

6. Para k — 1 hasta j —l 

V¡j = Vij U {A | A —* BC es una producción, B € y C G 


Este algoritmo calcula para todo 1 , 7(1 e {1,... ,n},j < n — j + 1), el conjunto de variables 
V¡j que generan u¡j, donde u¡j es la subcadena de u que comienza en el símbolo que ocupa la 
posición i y que contiene j símbolos. La palabra u será generada por la gramática si la variable 
inicial S pertenece al conjunto Vj„. 

Los cálculos se pueden organizar en una tabla como la de la siguiente figura (para una palabra 
de longitud 5): 


U 11 

«21 

«31 

«41 

«51 

V11 

V 2 1 

V31 

V 4 1 

V 5 1 

Vi 2 

V22 

V32 

V 42 


V13 

V23 

V33 



V14 

V 24 




Vis 






En ella, cada V¡j se coloca en una casilla de la tabla. En la parte superior se ponen los 
símbolos de la palabra para la que queremos comprobar la pertenencia. La ventaja es que es fácil 
localizar los emparejamientos de variables que hay que comprobar para calcular cada conjunto 
V¡j. Se comienza en la casilla que ocupa la misma columna y está en la parte superior de la 
tabla, y la casilla que está en la esquina superior derecha, emparejando todas las variables de 
estas dos casillas. A continuación elegimos como primera casilla la que está justo debajo de la 















Cap. 6 Propiedades de los Lenguajes Libres del Contexto 


125 


primera anterior, y como segunda casilla la que ocupa la esquina superior derecha de la segunda 
anterior. Este proceso se continúa hasta que se eligen como primera casilla todas las que están 
encima de la que se está calculando. La siguiente figura ilustra el proceso que se sigue en las 
emparejamientos (para un elemento de la cuarta fila, en una palabra de longitud 5). 


“11 “21 “31 “41 “51 



Ejemplo 75 Consideremos la gramática libre de contexto dada por las producciones 
S AB\BC 
A —■> BA\a 
B -> CC\b 
C —> AB\a 

Comprobar la pertenencia de las pcdabras bemba, aaaaa,aaaaaa cd lenguaje generado por la 
gramática. 

El Algoritmo de Early 

El algoritmo de Early es también de complejidad 0(n 3 ) en el caso general, pero es lineal 
para gramáticas LR( 1), que son las que habitualmente se emplean para especificar la sintaxis de 
las lenguajes de programación. 

Al contrario que el algoritmo de Cocke-Younger-Kasami que trata de obtener las palabras 
de abajo hacia arriba (desde los símbolos terminales al símbolo inicial, el algoritmo de Early 
comenzará en el símbolo inicial (funciona de arriba hacia abajo). 
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Sea G una gramática con símbolo inicial S y que no tenga producciones nulas ni unitarias. 
Supondremos que u[i..j\ es la subcadena de u que va de la posición i a la posición j. El 
algoritmo producirá registros de la forma (i, y, A, a, p), donde i y j son enteros y A —» ap es 
una producción de la gramática. La existencia de un registro indicará un hecho y un objetivo. El 
hecho es que u[i + l..j] es derivable a partir de a y el objetivo es encontrar todos los k takes que 
P deriva a u[j + \ ..k]. Si encontramos uno de estos k sabemos que A deriva u[i+ 1. -k]. 

Para cada j, REGISTROS\j] contendrá todos los registros existentes de la forma (i, j, A, a, (1). 

El algoritmos consta de los siguiente pasos: 

P1 Inicialización.- Sea 

• REGISTROS[ 0] = {(0,0, S, £, p): S —> P es una producción} 

• REGISTROS[j] = 0 para j = 1 

• j = 0 

P2 Clausura. - Para cada registro (i, j.A. a. By) en REGISTROS\j] y cada producción B ^ 8. 
crear el registro (j, j, B , £, 8) e insertarlo en REGISTROS\j] . Repetir la operación recursi¬ 
vamente para los nuevos registros insertados. 

P3 Avance.- Para cada registro (i. j.A. a. cyj en REGISTROS\j\. donde c es un símbolo termi¬ 
nal que aparece en la posición / + 1 de u. crear (i, /'+ 1. A. ac.yj c insertarlo en REGISTROS[j + 

I]- 

Hacer j = j + 1 . 

P4 Terminación.- Para cada par de registros de la forma (i, j.A. a. £j en REGIST ROS\j] 
y (h,i,B : yA,8) en REGISTROS[í). crear el nuevo registro (h. j.B.yA.8) e insertarlo en 
REGIST ROS[j]. 

P5 Si j < n ir a P2. 

P6 Si en REGISTROS[n\ hay un registro de la forma (0,n,S,a,e), entonces u es generada. 

En caso contrario no es generada. 

Ejemplo 76 Comprobar mediante el algoritmo de Early si la palabra baa es generada por la 
gramática con producciones: 

S-^AB, S-^BC, A—+BA, A^a, 

B^CC, B^b, C—>AB, C^a 

Después de aplicar el paso de inicialización, el contenido de REGISTROS[ 0] es: 
REGISTROS[0\:{0,0,S,£,AB) : (0,0,S,£,BC) 
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(0,0 ,A,z,BA), 

(0,0 ,A,£,a), (0,0 ,F,e,CC), (0,0 ,B,e,b), (0,0,C,e,AF), (0,0,C,8,a), 

FFG/SFRGSfl] : (0, l,B,b,é), (0,1,S,F,C), (0, 1,A,F,A), (1,1 ,C,£,AF), 

(l,l,C,e,a), (l,l,A,e,5A), (l,l,A,e,a), (1, l,5,e,CC), (1,1,5,e,fe) 

FFG/S77?0S[2] : (1 ,2, C, a, e), (1 ,2, A, a, e), (0,2, 5, BC, e), (0,2,A,FA, e), 

(l,2,C,A, J B),(l,2, J B,C,C),(0,2,5,A, J B),(0,2,C,A, J B),(2,2,5,e,CC), 

(2,2,F,£,Z>),(2,2,C,£,AF),(2,2,C,£,a),(2,2,A,£,FA),(2,2,A,£,a) 

FFG/SFFG5[3] :(2,3,C,a,E),(2,3,A,a,E), (1,3 ,F,CC,e), (2,3,F,C,C) 

(2,3,C,A,7?), (1,3,A,i?,A) 

Como (0,3,5, a, £) no está en REGISTROS[3\, la palabra baa no es generada 
S^T, S->S + F, F^F, T —> F * F, F -»• a, FF-> (S) 

Palabra: (a + b)*a 

REGISTROS^} :(0,0,S,£,F),(0,0,S,£,S+F), (0,0,F,e,F),(0,0,F,e,F*F), (0,0, F, £, a), (0,0, F, £, ¿>), ( 
FFG/5FFG5[1]:(0,1,F,(,5)),(1,1,5,£,F),(1,1,5,£,5 + F),(1,1,F,£,F), 
(l,l,r,E,r*F),(l,l,F,E,a),(l,l,F,E,fe),(l,l,F,E,(5)), 

FFG/SFFG5[2]:(l,2,F,a,£),(l,2,F,F,£),(l,2,5,F,£),(0,2,F,(5,)),(l,2,S,S,+F) 

FFG/SFFGS[3] :(1,3,5,5+, F), (3,3, F,£,F), (3,3,F,£, F*F), (3,3,F,£,a), (3,3,F,£,¿>), (3,3,F,£, (5)) 


FFG/5FFG5[4]:(3,4,F,¿,£),(3,4,r,F,£),(l,4,5,5+F,£),(3,4,r,F,*F),(0,4,F,(5,)),(l,4,S,5,+F) 
FFG/SFFGS[5] :(0,5,F, (S),e), (0,5,F,F,e), (0,5,5, F,e), (0,5,F,F,*F), (0,5,5,5,+F), 


FFG/SFFGS[6] :(0,6,F,F*,F), (6,6,F,£,a), (6,6,F,£,¿»), (6,6 ,F,e, (5)), 
FFG/SFFGS[7] : (6,7,F,«,e), (0,7, F, F*F,e), (0,7,5,F,e), (0,7, F, F, *F), (0,7,5,5,+F) 
Como tenemos (0,7,5, F, e), entonces la palabra (a + b) *c es generada. 


6.3.2. Problemas Indecidibles para Lenguajes Libres de Contexto 

Para terminar el apartado de algoritmos de decisión para gramáticas libres de contexto dare¬ 
mos algunos problemas que son indecidibles, es decir, no hay ningún algoritmo que los resuelva. 
En ellos se supone qhe G, Gi y G 2 son gramáticas libres de contexto dadas y R es un lenguaje 
regular. 

- Saber si L(Gi)nL(G 2 ) = 0. 

- Determinar si L(G) — T*, donde T es el conjunto de símbolos terminales. 

- Comprobar si L(Gi) = L(G 2 ). 

- Determinar si L(Gi) C L(G 2 ). 

- Determinar si L(G\) — R. 
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- Comprobar si L( G) es regular. 

- Determinar si G es ambigua. 

- Conocer si L(G) es inherentemente ambiguo. 

- Comprobar si L(G) puede ser aceptado por una autómata determinístico con pila. 
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